首页 理论教育 文献标引质量控制与评估

文献标引质量控制与评估

时间:2023-08-07 理论教育 版权反馈
【摘要】:标引深度是根据对文献主题内容揭示的广度衡量标引质量的一个因素。较高的标引深度有助于提高检全率,但会影响检准率。因此,关键是应当采用适当的标引深度。标引网罗度和专指度的综合反映就是标引深度。不同的标引单位或检索系统应该根据其设备条件、文献类型、用户需求、标引语言等因素规定合适的标引深度。在进行受控标引的情况下,这一专指度通常是通过类表或词表以及标引方法加以控制的。

文献标引质量控制与评估

文献标引是建立检索工具的关键环节,直接影响到检索效果,十分重要。衡量标引工作的质量涉及多种因素,其中包括以下内容。

(一)准确性要求

准确性即指对文献主题内容的揭示要准确;对文献主题概念的转换要准确;要求标引的文献内容和检索标识相符合。准确性包括以下两方面。

(1)在主题分析过程中对主题内容的分析和提炼要准确,提炼出来的主题概念应与文献中的主题概念相符。

(2)对分析出来的文献主题概念转换准确,应使用确切的标识对主题内容进行揭示。不允许检索标识与主题内容完全不相符或不相关,否则就是标引不准确。

如在上述两方面出现问题,就会造成漏检或误检,直接影响检索系统的检全率和检准率,要使标引结果符合上述目标,要求对文献主题内容有一定的分析和判断能力。

(二)网罗性要求

网罗性亦指“标引深度”,是指一篇文献所论述的各个主题概念被确认并转换为检索标识的完备程度。标引的网罗度也称适度性和穷举度,具体表现为标引的数量多少。在后组式检索工具中,通常指一篇文献被赋予检索标识的数量;在先组式检索工具中,则是指一文献占有的平均分类款目或主题款目数量。标引深度是根据对文献主题内容揭示的广度衡量标引质量的一个因素。较高的标引深度有助于提高检全率,但会影响检准率。因为提高标引深度后,必然会涉及文献未做重点论述的次要主题,从这些主题角度检出的文献包含该主题的信息量较少,从而影响检准率。反之,降低标引深度,可以提高检准率,但必须会影响检全率。因此,关键是应当采用适当的标引深度。不同检索系统应当根据其设备条件、系统的种类、文献类型、服务需要等,规定相宜的标引深度。机械检索系统容量大,组配灵活,宜采用深标引;手工检索工具受检索手段的限制,宜采用浅标引,分类检索系统大多采用先组方式,对主题揭示的数量一般应有一定限制;主题标引适宜于使用后组方式,往往可以根据检索需要采用较高的标引深度。专业文献单位通常对专业文献进行详尽标引;综合性文献单位则常在对一般文献概括标引的同时,有针对性地对某些学科或文献类型适当进行深度标引。

标引网罗度和标引专指度是相互联系,但有所区别的。标引网罗度和专指度的综合反映就是标引深度。标引深度不足或过大都会对检索效率产生副作用。不同的标引单位或检索系统应该根据其设备条件、文献类型、用户需求、标引语言等因素规定合适的标引深度。如机检系统宜采用深标引,手检系统宜采用浅标引;专业单位对专业文献宜深标引,对非专业文献宜浅标引。标引具体到一篇文献时,还应根据其文献价值决定适中的标引深度。

(三)专指性要求(www.xing528.com)

专指性亦称“专指度”,是指主题标识与文献主题概念的相符程度,是根据对主题概念揭示的精度衡量标引质量的一个因素。较高的专指度,有助于提高检准率,可以满足用户对特定文献的查找。相反,如果降低专指度,使用概括的标识对文献进行标引,用户就必须在概括类目或主题范围内进行查找,必然要花费更多的查找时间。当然,过分专指也会增加标引的难度,造成文献分散,影响检全率。因此,检索系统一般应保持适当的专指度。在进行受控标引的情况下,这一专指度通常是通过类表或词表以及标引方法加以控制的。一般情况下,应在主题分析的基础上,使用类表及词表中最确切的类目或主题词进行标引,以确保系统要求的专指度。

(四)一致性要求

所谓一致性,是指标引员对同一主题内容文献标引的一致程度。可以指不同标引员之间标引的一致性,也可以指同一标引员在不同时间标引同一主题文献时赋予标识的一致性。提高标引一致性,有助集中同一主题内容文献,提高检全率和检准率。常见的对标引一致性的测度为配对测度:即两个标引员的标引一致度,是将两人对同一文献共同标引的主题词数与两人使用的标引词总数之比。即一致度=AB 两人标引使用相同的词数/AB 两人标引所用总词数

按照这一公式,如A、B 两人分别用abcdef 和abcdgh 等主题词标引同一文献,则其一致度为:abcd/abcdefgh=4/8=0.50。

一致度的最高值为1,但实际上很难达到。这一方法也可以用来计算同一标引员标引的一致性。

提高标引的一致性,可以提高查全率查准率和检索的方便性、规律性。但是,标引的一致性受标引过程各环节以及标引人员水平、标引语言特点等多种因素影响,只有在测算标引一致性的基础上,分析标引不一致的原因,有针对性地加以改进,才能够达到较高的标引一致性。

(五)适用性要求

所谓适用性,是指标引应适合检索系统的特点和用户需求。不同文献单位对标引内容的取舍可以是不同的,专业文献单位一般要求对与专业相关的内容进行充分揭示,并且按照专业需要的方式加以组织。不同的揭示途径、不同设备条件对标引的要求也是不同的,一般情况下,分类标引适合于对文献采用整体性标引,必要时才以分析标引的方法对文献涉及的主题内容进行比较充分的揭示;手工检索系统通常必须对标引深度进行适度限制,机械检索系统则应根据系统特点进行充分揭示,必要时还可以采用职能符号、加权等手段,以达到较好的检索效果。

从上面的分析可以看出,标引的准确性、网罗性、专指性、一致性、适用性是从不同的方面对标引质量进行控制的手段,它们是与检索系统的特点和要求密切联系的。因此,必须根据检索系统的特征加以确定,使标引结果既不遗漏有价值的主题,又能准确、适用、详略得当,从而获得较好的检索效果。要达到上述目标,就必须根据检索系统的特点,建立完备的标引规范和方法的体系。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈