首页 理论教育 信息需求主体分析、数量分析

信息需求主体分析、数量分析

时间:2023-02-20 理论教育 版权反馈
【摘要】:对信息需求的分析可以从主题、数量、质量、时间要求及信息源等方面着手。因此,当我们在生活、工作中产生信息需求后,有必要分析需求数量,防止片面地认识问题,又避免信息过于泛滥。这主要涉及所需信息总量及查全率要求等,与我们信息需求的目的有关。以上是针对某个信息需求所产生的需求总量及查全率问题。

信息需求主体分析、数量分析

3.3.1 信息需求分析

产生信息需求后,对其进行分析是很有必要的。俗话说,磨刀不误砍柴工,先花一定的时间来做好准备,其最终效率必然更高。特别是在科学研究、企业管理等职业工作中产生的信息需求,认真分析更是必要。对信息需求的分析可以从主题、数量、质量、时间要求及信息源等方面着手。

3.3.1.1 信息需求主题分析

分析需求的主题内容,即所需信息的学科性质、特点和水平层次,这一点在使用专业的数据库时显得尤为重要。弄清学科性质的目的是明确检索的学科范围,学科范围越具体、越明确,越有利于检索。如果问题属于多学科或交叉学科,则分别列出多学科或交叉学科的相关部分,这对于确定所需信息在复杂的学科体系中的位置,对于从分类途径检索时选用上下位类来扩大或缩小查找范围都是大有裨益的。主题分析的质量同分析深度与广度有关。如果仅用一个简单的概念笼统地指出是什么事物,则检索时只要选用较为宽泛的简单主题词或上位主题词就可涵盖整个需求的内容;如果是用复杂概念来表达(如具体指出事物的特征,或它的某一方面、某一部分的问题),则检索时需要的检索标志数量较多,检索途径因此而增加,获得所需信息的可能性也增加。例如,有关输电线路技术,这就涉及其电压等级,一个输电塔上是单回线路还是双回、四回线路,是紧凑型还是常规型,是一般海拔还是高海拔地区等,这时,就须用多个概念加以组配,才能得到理想结果。因此,深入分析信息需求时,要注意展开需求的全部主题概念。如“国际投资流向”这个大概念可能要展开美、英、法、德、日等投资大国在某些国家和地区的投资这些小概念,仅仅对号入座般地选用“国际投资”这个主题词,得到的文献将是笼统地、不分国别地研究国际投资的文献。要注意,需求中有的概念是明确的,有的可能是隐含的,要弄清这些概念之间的关系,如并列关系、主从关系、交叉关系;要确定哪些是主要概念,哪些是次要概念,大胆舍去那些无关概念,使分析出的概念少而精。这对于计算机检索中检索式的构造是非常有用的。

主题分析还要同具体使用的检索系统相结合。目前,国内和国外数据库的主题分类是不同的,国外不同国家数据库的主题分类体系也有所不同,因此我们在使用过程中要加以注意。

3.3.1.2 信息需求数量分析

大家都很熟悉盲人摸象的故事。盲人试图判断大象的特征:依靠最初的接触,每个人都得到了不同的看法。大象像一棵树,像一条蛇,像一根绳子,像一垛墙,像一张毯子或是一杆矛。为什么会出现各种各样的判断错误?因为没有人掌握它的全部特征,信息收集得不全面。

另一方面,是否信息收集得越多越好?又不尽然。实际上,我们需要的是数量适度、能解决问题且能消化吸收得了的信息。因此,当我们在生活、工作中产生信息需求后,有必要分析需求数量,防止片面地认识问题,又避免信息过于泛滥。这主要涉及所需信息总量及查全率要求等,与我们信息需求的目的有关。

查全率是指检索出的相关信息量与存储的全部相关信息量之比。查全率可以用公式表现为:

查全率R=A/C

其中,A代表检出的相关信息量;C代表全部的相关信息量,包括检出和未检出的相关信息量。

在实际的信息需求中,有些情况下不必要求有很高的查全率,而有些情况下必须保证查全率。当然,不同的信息用户在不同时期,面对不同任务,对查全率的要求会有所不同。对于在校学生来说,查全率要求较高的信息需求主要有:

(1)确定对某一课题进行研究时(研究生论文、发明创新等)。

(2)撰写一篇综述文献时。

(3)对某一陌生的事物想深入、全面了解时。

当然,在保证查全率的同时,我们也要对总量加以控制。现在的社会,从某种程度上来说,信息不是少了,而是太多了。当我们面对太多的信息以至于无法吸收时,也会产生困惑的。所以,信息的数量对于需求者来说,有个适度问题。

以上是针对某个信息需求所产生的需求总量及查全率问题。而对于信息用户整体来说,其信息需求数量存在着以下几种情况:

●穆斯(Mooers)定律

穆斯在研究用户利用信息检索系统时发现:“一个信息检索系统,如果对用户来说,取得信息比不取得信息更伤脑筋和麻烦的话,这个系统就不会得到利用。”穆斯的这一基本定律不仅适用于用户信息检索的行为,而且从更广的范围内表述了用户信息需求的根本原则:如果用户取得信息比不取得信息更麻烦和伤脑筋的话,他将放弃对这一信息的需求。对这类人来说,其表达出的信息需求会越来越少。

●齐夫(Zipf)定律

齐夫在他的专著《人类行为与最小努力原则》中指出:“每一个人在日常生活中都必定要在他所处的环境里进行一定程度的运动。”他把这样的运动视为在某种道路上行走,而且都将受一个简单的基本的原则制约,即“最小努力原则”的制约。在这一原则制约下,人们力图把他们可能付出的平均工作消耗最小化。显然,这一原则是存在的。

用户的信息需求产生于他的实践活动,当他根据实践活动的需要决定其信息需求量时,必然希望在解决问题的前提下获取和吸收信息的工作量最小。可见,用户的信息行为如同广义的走路,符合齐夫最小努力原则。当然在实际问题中,符合最小努力原则的用户行为与规律是极其复杂的。

马太效应

在《圣经·马太福音》中有一句话,说有钱的还要给他更多,没钱的就连已有的这一点也要给它剥夺掉。有人说这就是所谓“成功产生新的成功”。巨商豪富积聚财富的门路很多,再多赚点钱不费多大力气,相比之下,穷人要想多弄点钱则十分困难,因为一个步入良性循环,另一个则步入了恶性循环。

对于为数不多的信息需求量较大的用户,随着时间的推移,信息需求量将愈来愈高于平均水平,这部分用户在行为上表现为力图占有更多更新的信息资料;在信息资料来源不充分的情况下势必影响其他用户的需求。这种两极分化的现象就是信息需求中的马太效应。

3.3.1.3 信息需求质量分析(www.xing528.com)

这时所说的信息需求质量主要是指我们得到的信息是否是真正需要的信息,它主要涉及我们对信息源的选择及信息查准率的问题等,有关信息源在后面有专门论述,这里先讨论一下查准率问题。

查准率是指检索出的相关信息量与检索出的总信息量之比。查准率可以用公式表现为:

查准率P=A/B

其中,A代表检出的相关信息量,B代表全部检出的信息量,包括检出的相关信息量和非相关信息量。

在同一运行环境下,查全率和查准率是两个矛盾的参数,一方面性能提高,另一方面性能就会有所下降。这是因为,若要增大查全率,必须使需求表达尽量全面,以确保获得所有可能相关的信息,因此,我们最终得到的信息量要比实际需求的信息量大,这就造成了相对低的查准率;若要增大查准率,必须准确表达其需求,从而保证我们获得的信息肯定是需要的信息,这就造成一些相关信息不可避免地会被漏掉,降低了查全率。

信息需求的质量还与获得信息的正确性和可靠性有关。信息(特别是科技信息)的正确性与可靠性是衡量其有无价值的必要条件,某一信息如果缺乏这两个方面就失去了使用价值。因此,一般情况下应注意以下问题:信息产生时间、内容的新颖程度、信息创造者或提供者的可信度、该信息被利用的情况等。

信息需求的质量还与获得信息的完整性有关。零散、片面的信息会导致错误的结果。

信息需求的质量还与获得信息对用户的适应性有关。同一个信息对不同的用户产生的效果会有很大差异。它与用户的类型及用户当前的任务、面临的任务及用户自身因素等相关。

3.3.1.4 信息需求的时间性分析

信息需求的时间性主要包括所需信息的时间段要求和获取信息的及时性要求。针对不同的目标,信息需求的时间性要求会有所不同。

确定所需信息的时间范围是为了使检索更经济、快捷、准确。对于需要较多回溯性资料的问题,我们就要确定查找年代的上限和下限;而如果需要近期文献,那么就要确定是近五年、近三年还是限于去年以来的?当查不到某一特定文献时,时间的差错是应考虑的一个主要原因。

获取信息的及时性与信息需求目的直接相关。战争时期,军事信息的及时获得往往决定战斗或战争的成败。而和平时期,像新闻工作者,对信息的及时性最为敏感,独家首次报道比后面跟踪报道的影响力要大得多。

3.3.1.5 信息需求信息源分析

在信息需求的满足过程中,必然涉及对信息源的分析、选择及利用。不同的信息需求也会对信息源的选择产生影响。

一般说来,信息源可分为文献信息源和非文献信息源两大类。在满足信息需求的过程中,必不可少的步骤是对信息源中我们需要的信息的索取(检索)。相对说来,文献信息源是学科信息检索的主要对象,但对一些特定领域的研究,其非文献信息源又是必须的,如考古工作。还有一些时候,这两类信息源都必须利用。

在确定了何类信息源是我们的首选后,我们还要对信息源的优劣进行一定的评价,作为选择信息源的依据。

以文献信息源(数据库)为例,评价信息源的质量因素主要有以下几方面:

●内容因素。指文献的覆盖面,包括学科内容、文献类型及出版物数量、时间跨度等。

●时间因素。主要是数据更新的及时性。

●标引及词表因素。它体现了一个检索系统(数据库)的标引质量,直接影响到检索功能的运用和检索质量。

●检索软件功能因素。对用户而言,体现在两个方面:一是界面是否友好,操作是否简单,功能是否满足要求;二是检索效率优劣,包括检索响应速度及检索结果是否满足要求。

选择了实用的信息源后,如何利用好信息源,与对信息需求的分析、信息源的了解及检索策略的制订紧密相关。

我们还是以文献信息源为例来看看应注意哪些问题。

由于检索系统都是针对一定的问题而设计的,因此,首先将问题分类有助于确定相应的检索系统。所有问题可以分成两大类:一类是查找某一特定的文献,或与某一主题、学科内容相关的文献,这就要考虑文献检索类工具(二次文献)。例如,要查找投资分析文章,就要用一些文摘或全文数据库;要找图书,会用到馆藏目录、联合书目,或者访问电子书刊网站、网上书店等。另一类是查找具体的事实,如统计数据、人名地址、机构概况、法律条文、术语等,这就要考虑专为解决这类问题而设计的参考工具(三次文献):统计年鉴、传记工具书、机构名录、手册、字典、百科全书,或者包含这类参考工具的相关网站。当然,问题的类型并没有严格的界限,而且是可以互相转化的。例如,事实类的问题可以通过查找文献来解决,而对文献类的问题经过进一步分析后,也可以用三次文献中的某一工具书来解决。

在对信息需求分析中,如果通过文献信息源可以满足需求,那么文献类型的分析也很重要。比如,仅仅确定需要某主题的近期文献是不够的,还需要进一步确定具体的文献类型,是图书、报纸还是专利文献等。这样才可能比较迅速准确地找到所需信息,满足需求。一般说来,非专业人员接触的文献种类较少,因此总是偏爱平时常用的几种类型(如图书、期刊),很少考虑其他来源。为此,我们应该扩大检索思路,尤其是在单一类型的文献中查到信息的数量、质量不尽满意时,使用那些常被人们忽略的报告、政府文献等特种文献就可以获得有价值的信息。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈