首页 理论教育 学术文本词汇功能分析方法及应用

学术文本词汇功能分析方法及应用

时间:2023-11-20 理论教育 版权反馈
【摘要】:研究方法在一个学科的知识体系中具有重要的地位。随着信息计量学学科的发展,其自身具有特色的研究方法不断增加,同时,也不断借鉴其他学科的研究方法,将其应用于本学科。图8-6具有研究方法语义功能的高频关键词①指标。主要有社会网络分析法、内容分析法。内容分析法本质是对文献等传播媒介中所含的信息量及其变化进行分析,信息计量学领域学者主要将其用于引文内容分析以及基于文本挖掘的内容分析等。包含有数据包络分析等。

学术文本词汇功能分析方法及应用

研究方法在一个学科的知识体系中具有重要的地位。随着信息计量学学科的发展,其自身具有特色的研究方法不断增加,同时,也不断借鉴其他学科的研究方法,将其应用于本学科。如图8-6所示,可以分为以下几类:指标、理论模型、定律、算法以及其他方法。

图8-6 具有研究方法语义功能的高频关键词

①指标。包含有 h-index、impact factor、g-index、citation window、gini coefficient、r-index、percentiles、fss以及crown indicator。由此可知,信息计量学领域研究过程中经常使用各种指标,h-index、impact factor、g-index、r-index、percentiles以及crown indicator等经常被用来评价期刊、作者以及机构等的影响力。Bouysso和Marchan比较了基于h-index和g-index等计量指标对作者或者作者群体进行排名的情况[168];citation window表示引用窗口,不同的引用窗口会影响影响因子等各种基于此的计量指标的值,从而会影响评价对象的排名;gini coefficient来源于经济学领域,用于衡量一个国家或地区的居民收入差距的指标,信息计量学领域学者将其应用于基金资助分布、引文分布等的不平等性的衡量,Wu使用基尼系数衡量了中国自然科学基金资助的机构和学科分布的不平等现象[169]

②理论模型。包含stochastic model、matthew effect、entropy、discretised lognormal distribution以及lorenz curve。由此可见,信息计量学领域较多使用不同学科的理论模型,如数学领域的随机模型、离散正态分布信息学领域的熵,社会学领域的马太效应以及洛伦兹曲线。Quentin提出了一种简单随机模型模拟作者论文的出版和被引的过程,来研究作者职业生涯、引文率等与作者的h指数之间的关系[170];Birkmaier等研究了基于引文的作者之间可能具有的马太效应[171]

③定律。主要有hooked power law、Zipf's law以及Lotka's law。其中奇普夫定律和洛特卡定律属于文献计量学领域的四大定律,得到广泛的应用;此外,幂律也经常被信息学领域学者用于引文分布等的研究。

④算法。主要是PageRank。PageRank算法最初是由谷歌发明的,用于网页的排序;该领域的研究人员将其应用于作者网络、论文网络、机构网络等不同网络的结构研究,从而可以对作者、论文和机构等进行排序,Nykl等使用PageRank算法及其变形来研究作者的引文网络,从而对作者进行排序[172]。(www.xing528.com)

其他方法又可分为4类:本学科特色研究方法、社会科学的研究方法、统计学的研究方法以及计算机学科的研究方法。

①本学科特色研究方法。主要包含有引文分析法、引文网络以及耦合分析。引文分析方法具有多种用途。首先,基于引文数量分析,可以用于评价期刊和论文;其次,基于引文网络分析,可以用于揭示科学结构,也可以应用于学科相关度以及文献检索等相关研究。如Xiao等构建引文网络,同时结合网络分析,来研究知识扩散结构[173]

②社会科学的研究方法。主要有社会网络分析法、内容分析法。社会网络分析法是对社会网络中行动者之间的关系进行量化研究的重要方法[174],信息计量学领域学者将其应用于引文网络、合作网络、机构的网络、作者的网络等的分析。Cimenler应用社会网络分析方法对南佛罗里达大学工程学院的100名终身教职基于论文、提案以及专利的合作网络进行分析,来评估合作的情况[175]。内容分析法本质是对文献等传播媒介中所含的信息量及其变化进行分析,信息计量学领域学者主要将其用于引文内容分析以及基于文本挖掘的内容分析等。Kim等在以往作者共引分析中加入对引用内容的分析,来判断不同作者研究主题的关联性[176]

③统计学的研究方法。包含有数据包络分析等。数据包络分析是一种针对多投入与多产出的多个决策单元效率评价方法。例如,Lee等应用了一种自底向上的数据包络分析方法来评估不同研究机构受政府资金资助的项目的效率,从而来指导政府基金的资助政策的制定[177]

④计算机学科的研究方法。主要有聚类分析可视化分析、文本挖掘等。其中,聚类分析主要应用于文本主题的挖掘;可视化分析方法将研究结果直观地展示出来,有利于加深对研究结果的理解。如Jeong使用主题建模的技术进行抗胰腺癌药物聚类分析,并通过药物与靶点网络分析来跟踪药物靶点的变化,为抗胰腺癌的新药研究提供参考与建议。[178]

由上述的分析可知,信息计量学领域的研究方法不断丰富。对指标、理论模型以及其他研究方法而言,信息计量学领域不仅使用自己本领域的,同时也在不断借鉴和吸收其他领域的研究方法,反映了信息计量学领域研究的多学科交叉,也是情报学作为一个计算机科学、社会科学等多学科交叉学科的一个具体表现[179]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈