首页 理论教育 主题语言的重要性及其发展趋势

主题语言的重要性及其发展趋势

时间:2023-07-19 理论教育 版权反馈
【摘要】:主题语言是以主题词作为文献内容标识和检索依据的语言。以主题语言来描述信息内容的处理方法称为主题法。主题词表由受控的自然语词组成,它是一套人工的符号系统,是在一定程度上达成共识或成为标准的一套主题规则。主题语言包括以下4种。单元词绝大部分不是具体的标题,组配是单元词语言的突出特点。关键词语言已成为当前互联网最主要的检索语言,也是检索语言的发展趋势。

主题语言的重要性及其发展趋势

主题语言是以主题词作为文献内容标识和检索依据的语言。以主题语言来描述信息内容的处理方法称为主题法。主题法的具体形式是主题词表。主题词表由受控的自然语词组成,它是一套人工的符号系统,是在一定程度上达成共识或成为标准的一套主题规则。主题词表规定了哪些词在主题标引或检索时可以作为正式词,哪些是非规范化的词,不能用来标引或检索,并将其指引到正式主题词,同时列出了各主题词之间的等级关系、相关关系、同义关系等。

主题词是经人工规范化处理的最能表达文中主题概念的语词。所谓规范化处理,就是在文献存储和检索时,对同一主题概念的同义词、近义词、多义词、学名、俗名、商品名、英美的不同拼法、单复数形式、全称、缩写等加以规范,使与此主题概念有关的文献都只集中在一个主题词下,从而体现了主题词的单一性。例如,自行车单车、脚踏车这3个表达同一个概念的词,只有“自行车”是经过规范化处理的主题词,所有有关的文献都集中在“自行车”这一主题词下。

主题语言包括以下4种。

(1)标题词语言。

标题词语言是最早的一类主题语言,以规范化的自然语义作为标识来表达文献的主题概念的词语称为标题词。著名的标题词表有《工程标题词表》(Subject Headings for Engineering,SHE)《美国国会图书馆标题表》等。标题词语言是一种先组式的主题检索语言,通过主标题词和副标题词的固定搭配来检索。 《工程标题词表》由美国工程信息公司编辑出版,与《工程索引》配套使用。1987年和1990年又分别进行了修订。1993年彻底改版为《EI叙词表》(EIThesaurus)。《工程标题词表》的标题词被分为主标题词和副标题词,构成主从关系。主标题词全部大写,副标题词首字母大写。主标题词大多数是原料、机器部件、仪表、设备等物别名词,副标题词对主标题词进行限定、修饰和细分,表达主题的某一方面的特征,如作用、性能、制造、工艺处理和操作方法等。

标题词语言是具有固定组配的词表,随着科学技术的发展,新主题、新学科的涌现,其先组式的主题方式使词表中的词量随之不断增加而显得臃肿不堪,标题词语言因不能适应时代发展的需要,现在已经很少使用。

(2)单元词语言。

单元词是从文献中抽取出最基本的能够表达文献主题的不可再分的词汇。单元词语言通过单元词字面的组配来表达文献的概念。单元词是一种后组式语言,即到检索时才将它们进行组配,根据检索的需要增减单元词,从而达到扩大、缩小检索范围的作用。单元词将所有的主题概念分解为更为一般的、单纯的概念,每一个单元概念一般只需用一个单纯词或合成词来表达,单纯词如氧、逻辑、马克思乌鲁木齐等,合成词如文字、图书馆、车床、铁路、隔音、焊接、污染等,这些词在概念上不能再进一步分解,否则不能表达其本身专业概念。单元词绝大部分不是具体的标题,组配是单元词语言的突出特点。若干个单元词通过不同的组配方式,可以构成许多具有复杂概念的标题。例如,“隔音”和“板”组配成“隔音板”这个主题概念。在检索时可将某些单元词组配起来使用,但字面的组配不是概念上的组配,“电子工程”不是单元词,只有“电子”和“工程”才是单元词,“防腐蚀”不是单元词,它可以分解为“防止”和“腐蚀”两个单元词。

由于单元词语言是字面组配,不够严谨,因此时常会出现组配出错的状况。单元词语言由于专指度较低,词间没有语义关系,对查准率有较大的影响,逐渐被叙词法取代而不复存在。(www.xing528.com)

(3)关键词语言。

关键词是从文献的标题、摘要甚至正文中抽取出来能够表达文献主题并具有检索意义的语词。关键词一般来说是直接从文献中提取的不予规范的自由词,它不受词表的控制,不进行词汇控制,不显示词间关系。关键词抽词的自由性方便了标引工作,提高了标引速度,降低了标引成本。但是,关键词是一种未经规范化处理的自然语言,存在着多义性、同义性、模糊性、词量大等情况,特别是同义词与近义词、上位词与下位词、全拼词与缩略词等均有可能同时被标引,极容易造成信息的漏检和误检,从而影响文献检索的查准率和查全率。关键词因其用词的自由,用户容易掌握,适应能力强,广泛应用于网络环境下的数字化信息检索,绝大部分的数据库搜索引擎等计算机检索系统都提供关键词语言的检索方法。关键词语言已成为当前互联网最主要的检索语言,也是检索语言的发展趋势。

(4)叙词语言。

叙词语言采用表示单元概念的规范化语词的组配来对文献主题进行描述的后组式词汇标识系统。叙词是从自然语言中优选出来经过规范化处理的名词术语,其词汇由表达各学科基本概念的名词术语和特定事物的专有名词所组成。例如,用叙词来标引“论图书情报名词标准化” 这一概念,则可以组配标引为“图书馆学”“情报学”“术语”“标准化”4个叙词。叙词法保留了单元词法组配的基本原理,但是它采用概念组配代替单元词法的字面组配,弥补了某些词拆分后再组配时产生意义失真的缺陷。叙词的组配有概念相交、概念限定、概念概括和概念联结等。

叙词语言将所涉及的各种概念,以规范的词或词组的形式固定下来,构成叙词表。常用叙词表主要有我国许多文摘检索刊物使用的《汉语主题词表》、英国《科学文摘》使用的《INSPEC叙词表》、美国《工程索引》使用的《Ei叙词表》、美国《政府报告和索引》使用的《NTIS叙词表》等。叙词表利用参照系统来提示叙词之间的内在联系,叙词之间的关系有等同关系、等级关系和相关关系。等级关系用“代”这个参照符号,用于从叙词处指明它所代替的那些非叙词,如“交际舞”是叙词,“交谊舞”是非叙词,用“交际舞”代“交谊舞”,用“经济扩张” 代“经济渗透”“经济侵略”“经济奴役”。等级关系用“属”和“分”两个参照符号表示,“属”用于从下级叙词指向上级叙词,“分”用于从上级叙词指向下级叙词,“属”和“分”互为反参照。例如,图书馆分为儿童图书馆、公共图书馆、国家图书馆、学校图书馆、专业图书馆,这些都是“图书馆”的下级叙词。相关关系用“参”来表示,交叉概念、对立统一概念、因果概念、并列概念、矛盾概念、近义词、反义词之间的叙词之间都用“参”来表示相关关系,如“行车安全”参“行车事故”“改良主义”参“改良派”等。

叙词语言由于具有直观性、单义性、专指性、组配性、多维检索性等优势,成为目前应用较广的一种专业性检索语言。

《汉语主题词表》如图2-3所示。

图2-3 《汉语主题词表》

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈