首页 理论教育 主题语言的选择与表达

主题语言的选择与表达

时间:2023-07-08 理论教育 版权反馈
【摘要】:经过选择,用来表达这些主题的语词,称为主题词。在主题语言中通常用参照系统等方法揭示主题词之间的概念逻辑关系。在主题语言中,以自然语言作为主题概念标识,以自然语言的字顺对信息进行排列、组织以及检索。而主题语言条件下,这些信息可以集中在“港口”这一主题下,并在这一主题下集中检索信息。关键词语言是为了适应目录索引的编制过程自动化的需要而产生的,与标题词、叙词一样,同属于主题语言。

主题语言的选择与表达

主题语言同分类语言一样,也是一种从信息内容角度对信息资源、文献信息进行标引、组织与检索的方法。它们的区别在于,分类语言关注信息的知识、学科属性,而主题语言关注内容的主题。主题语言从主题角度组织和揭示信息资源,从主题角度来检索信息。

主题在不同使用环境中可以有多种不同的理解。就本节而言,主题主要指信息资源、文献信息内容中所论述的主题对象,包括事物、问题、现象、方法、手段、目的、学科等。经过选择,用来表达这些主题的语词,称为主题词

1)主题语言的概念

主题语言一般是指直接以表达信息主题内容的语词作为主题概念的标识,以字顺为主要途径对信息资源、文献信息进行标引与组织,对信息进行检索的语言。在主题语言中通常用参照系统等方法揭示主题词之间的概念逻辑关系。

2)主题语言组织与检索信息的特征

(1)直接用自然语言的语词作为组织与检索信息的标识。主题语言不同于分类语言用符号作为标识,而是以选用的自然语言语词进行信息的标引,以语词组织信息以及检索信息。如“集装箱航线”这一主题在《中图法》分类中应为“F5交通运输经济”下的“F551.41”,或者为“U692.33”。而在主题语言下,可以用“集装箱运输*航线”“集装箱航线”直接组织与检索信息。

(2)以字顺作为主要组织与检索途径。在主题语言中,以自然语言作为主题概念标识,以自然语言的字顺对信息进行排列、组织以及检索。

(3)以特定的事物、问题、现象、方法、目的等主题为中心,集中信息资源。分类法在组织信息时主要考虑信息内容的学科,是学科集中原则。而主题语言是主题集中原则。那么在检索时就能在同一主题下,检索到涉及不同方面的信息。如“港口管理”“港口经营”“港口设备”“港口安全”等在分类语言中分属于不同学科,这些信息分别组织在不同的学科下,必须从多学科进行信息检索。而主题语言条件下,这些信息可以集中在“港口”这一主题下,并在这一主题下集中检索信息。

(4)通过详尽的参照系统方式揭示主题词之间的关系。主题词系统采用参照系统揭示主题概念之间的逻辑关系,反映主题词的相互联系。例如设置用、代、属、分、参等参照内容,反映主题词与其他主题词的关系。检索用户也可以在了解这些关系后检索到与之关联的信息。

3)主题语言的种类

(1)标题词。标题词语言是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索信息的语言。所谓标题词,是指经过词汇控制、经过规范化处理的名词术语等自然语言,用来标引与检索文献信息的词或词组。

标题词语言主要以主标题词、副标题词为基本单元构成。主标题词是用来表达信息内容与提问内容的主题,以经过规范化的名词术语为标识。副标题词也是经过规范化处理的自然语言,用来修饰、限定和细分主标题,起到主题概念的组配作用。

标题词的规范化处理主要通过编制标题词表,在词表内对选用的标题词进行规范化。标题词的规范主要是对词的词形、词义的规范与控制,在词表内对主标题词与副标题词之间的关系进行预先组配。所以,标题词语言是一种先组配式语言。

标题词组织信息与检索信息的特点是:①采用列举式词表,形式直观,便于信息组织与检索时对标题词的选择。②先组式标题结构固定,含义明确。③按照词表列举的主标题词和副标题词进行信息标引与检索,操作简便。④通过参照系统对词汇关系进行控制,揭示标题词之间的相关性,起到标引与检索时选用相关主题概念词功能,使标引与检索更加准确。(www.xing528.com)

(2)叙词。叙词语言是一种从自然语言中精选出来、并经过严格处理的语词作为主题标识,通过概念组配方式表达信息主题、标引信息和检索信息的语言。叙词是指经过规范化处理的以基本概念为基础的自然语言,用来标引与检索文献信息的词或部分词组。

叙词语言是在吸收与发展单词组配、标题词的词汇规范和参照系统以及分类语言中的知识分类原理的基础上产生的语言。在吸收众多原理和方法后,概念的组配原理决定了叙词语言是一种后组式语言的特点。

概念组配的原理在根本上不同于自然语言的字面组配。字面组配是指词语的字面拆分与组合,是一种字符层次上的组配,就是将字与字组合起来。而概念组配是用词语所代表的概念意义的分拆与组合,是语义、概念层次的组合。如“航运政策”用字面组配时,就采用“航运”“政策”两词进行字面组配而成。而在概念组配条件下,须用“船舶运输”“运输政策”两个词语组配。

叙词语言同样需要编制一个词表,将从自然语言中优选出的词汇列在词表内。一般能够入选叙词表的词汇主要是一些在概念含义上不能再细分的基本概念词,即单元概念词,但考虑到对文献信息的专指度,也有部分复合概念的词汇列在表中。这些基本概念与复合概念的词汇能够表达信息内容的概念与检索提问时的概念,并且能用于信息标引与检索。叙词的语词控制与规范化处理,也是在叙词词表内实现的。

叙词组织信息与检索信息的特点是:①结构完备,词汇控制严格,可以根据检索系统的需要对词汇进行有效控制。②组配性能强。通过组配,能对新出现的复杂概念用组配后的词汇进行表达、标引与检索。③标引能力强,能够准确、专指地标引和揭示各种主题内容。④检索效率高。通过灵活组配方式进行多种途径的检索,达到很好的检索效果。⑤对检索系统适应能力强。可以同时适用于标识单元和文献信息单元的检索方式,既能较好地适应计算机检索系统的要求,又能适应手工检索系统的需要。

(3)关键词。关键词语言是为了适应目录索引的编制过程自动化的需要而产生的,与标题词、叙词一样,同属于主题语言。但它不像标题词、叙词语言那样需要对词汇作处理与控制,关键词基本上不作规范化处理,或者仅是极少量的规范化处理。

关键词,是指那些出现在文献信息的标题、摘要、正文中,对描述文献信息主题内容具有实质意义的词语,即对提示和描述信息主题内容是重要的、带关键性的词语。

关键词语言的基本原理是直接以自然语言的单词作为表达文献信息和提问标识。因而当关键词确定时,不必编制专门的词表,既不用词表确定与显示词汇,也不进行词汇控制,不显示词间的逻辑关系,很适合计算机自动抽取词汇。由于词间不存在逻辑关系,所以关键词相互之间是一种平等的关系。

关键词组织信息与检索信息的特点是:①直接在文献信息的题名、正文、摘要中选用关键词,组织与检索时不必受词表的限制。②没有词表控制,任何有实质意义的词,都可以作为组织时的标引词与检索时的检索词。③词间是平等关系,且以字顺排检关键词以及多种形式的轮排,增加了信息检索的入口点。④由于没有词间的逻辑关系控制,对关键词的掌握相对容易,但也带来检索效果欠缺与检索正确度较弱等问题。

4)主题检索和分类检索的区别

主题是横向搜集信息,分类是纵向搜集信息。主题法归类的标准是知识对象的本身,而不是知识的科学性质,这样就集中了不同观点、不同方法去研究同一对象的资料。但是,用同样方法、同样观点研究不同对象的资料却被分散了。

分类法的基本特征是知识的系统性,主题法的基本特征是知识的特指性。分类法根据科学领域划分门类,归类的标准是知识的科学性质,而不是知识的对象。由于同一对象可以从不同的科学角度去研究它,因而关于同一对象的资料便分入不同的学科、不同的类。但用同样方法、同样观点研究不同事物的资料,却可以集中在一处。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈