首页 理论教育 引文分析理论:基于学术单元的多维度标签构建研究

引文分析理论:基于学术单元的多维度标签构建研究

时间:2023-07-31 理论教育 版权反馈
【摘要】:以SCI、SSCI、A&HCI为基础构建的引文分析理论,成为文献计量学与学术评价最主要的数据来源,并由此产生了较多的应用。3.4.1.2文献耦合理论文献耦合最早是由美国人开思勒于1961年提出的。[59]3.4.1.3同被引理论文献同被引理论由美国人斯莫和苏联人马尔莎柯娃于1973年提出。3.4.1.4“h指数”引文索引最直接的使用,主要是论文被引量。

引文分析理论:基于学术单元的多维度标签构建研究

以SCI、SSCI、A&HCI为基础构建的引文分析理论,成为文献计量学与学术评价最主要的数据来源,并由此产生了较多的应用。引文分析理论可以用于测定学科的影响和重要性、研究学科情报源分布、确定核心期刊、研究文献老化规则等。

这些应用往往是由在引文分析理论的基础上构建出新的理论来完成的。这些理论中,至今仍在使用的重要发现有影响因子、文献耦合同共被引理论、“h指数”等。

3.4.1.1 影响因子

影响因子(impact factor)是1972年由SCI的创立者加菲尔德提出的,现在是JCR(期刊引证报告)中的一项数据。影响因子是一个相对统计量,其计算方法是将某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。影响因子现已成为国际上通用的期刊评价指标,它不仅是一种测度期刊有用性和显示度的指标,而且也是测度期刊的学术水平乃至其论文质量的重要指标。

3.4.1.2 文献耦合理论

文献耦合(bibliographic coupling)最早是由美国人开思勒(M.M.Kessler)于1961年提出的。开思勒把两篇(或多篇)引用同一篇论文的论文称为耦合论文(coupled papers),并把它们之间的这种关系称为引文耦合。为了进一步从将耦合的情况以量化的方式进行研究,他又引入了耦合强度的概念(coupling strength),即若两篇论文同时引用了一篇文献,此两篇论文的耦合强度为1;当该两篇论文同时引用了两篇论文时,其耦合强度为2,以此类推。耦合强度越强,就意味着文献间在学科内容上的联系越紧密。因此,利用耦合强度使我们有可能划分出在学科、专业上相近的一个个由耦合强度较高的论文构成的论文簇(cluster of papers),并且找出簇(其实就是学科或专业集团)与簇之间疏密不同的联系。耦合理论把表面上没有联系的众多论文用耦合关系组成有序结构,研究这种结构可以揭示相关研究的发展历史和规律。因此,对论文的耦合规律进行分析研究,对情报学图书馆学、文献学、科学学乃至科技史都有很强的实用价值。随着耦合理论研究的深入,研究者把耦合对象扩展到学科、著者、期刊等,研究学科耦合、著者耦合、期刊耦合等。[59]

3.4.1.3 同被引理论(www.xing528.com)

文献同被引理论(co‐citation)由美国人斯莫(Henry Small)和苏联人马尔莎柯娃(I.V.Marshakova)于1973年提出。同被引指两篇论文被一篇后出的文献同时引用,则这两篇论文之间的关系称为同被引关系。与耦合强度概念相似,同被引定义了具有量化意义的概念同被引强度(co‐citation strength)来量度两篇论文之间的联系程度。两篇论文同时被一篇文献所引用,则其同被引强度(又称同被引频次)为1,以此类推。同被引频次越高,表明它们之间的联系越密切。同被引关系使我们不仅可以研究文献耦合所能研究的课题,而且还可以对学科结构、学科之间的联系以及文献之间的联系进行历史的动态研究,这也是文献同被引分析近年来被广泛应用的原因之一。继斯莫之后,美国人Howard D.White把同被引的概念引入著者,进行了著者同被引分析。之后,学者们把同被引引入学科、期刊甚至类目等,形成了文献同被引分析、著者同被引分析、学科同被引分析、期刊同被引分析、类目同被引分析等。

3.4.1.4 “h指数”

引文索引最直接的使用,主要是论文被引量。论文被引量是以论文被引总量的高低对论文、学者、机构进行评价,取代此前发文量多少的评价,这种评价几乎已经被所有的机构和学者所接受。比如,WoS数据库中直接可以查询机构论文被引总量,作为对机构的一种评价。但“h指数”的提出,修正了这种简单的方式。

“h指数”(h index)是2005年由美国加利福尼亚大学圣地亚哥分校的物理学家乔治・希尔施[60]提出的。“h指数”的计算基于其研究者的论文数量及其论文被引用的次数。赫希认为:一个人在其所有学术文章中有N篇论文分别被引用了至少N次,他的“h指数”就是N。可以按照如下方法确定某人的“h指数”:①将其发表的所有SCI论文按被引次数从高到低排序;②从前往后查找排序后的列表,直到某篇论文的序号大于该论文被引次数。所得序号减一即为“h指数”。

“h指数”是一个混合量化指标,可用于评估研究人员的学术产出数量与学术产出水平,一个人的“h指数”越高,则表明他的论文影响力越大,从而以此评价一个人的学术成就。同时,研究者发现生物学家的“h指数”都偏高,表明“h指数”就像其他指标一样,不适合用于跨学科的比较。

“h指数”产生后,有较多的学者根据“h指数”的思路提出了自己的基于ISI数据库的指数体系。如叶鹰提出了“f指数”[61],与“h指数”基于WoS数据不同,f指数是基于ISI库的另一个数据ESI。叶鹰指出:“在‘h指数’启发下发现的f指数和‘h指数’一样具有简单、稳健的优点,也都有片面、迟钝的缺点,并均可用于学者、机构、期刊、国家等层面。与基于WoS(Web of Science)的‘h指数’相比,基于ESI(Essential Science Indicators)的f指数的区分度略好。”“但是f指数小于1的情形很多,区分度不明显,为增大区分度或细化度以便实际应用”[62],叶鹰教授又提出了“对数f指数”的概念,认为“把f指数放大100倍取对数后再放大100倍定义为对数f指数fl。作为一种可以普遍应用的学术排序参数,f指数是优秀的象征——具有f指数的团体和个人都相对优秀,而对数f指数fl可使区分度更细化——fl≥200表征非常优秀,100<fl<200表征比较优秀,fl≤100表征相对而言不够优秀”[63]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈