首页 理论教育 科学知识图谱绘制方法

科学知识图谱绘制方法

时间:2023-10-21 理论教育 版权反馈
【摘要】:两篇文献构成共被引关系的条件是这两篇论文同时出现在第三篇文献的参考文献中。运用多元统计技术,如因子分析、聚类分析和多维尺度分析,可以按照共被引关系对某个学科领域的重要文献期刊进行分类,以确定学科研究主题的变化和发展模式。

科学知识图谱绘制方法

(一)多元统计分析

多元统计分析是一种综合分析方法,由经典统计学发展而来,属经典统计学的一个分支,它能够在多个物件和多个指标互相关联的情况下分析它们的统计规律,在本研究中运用的有聚类分析、因数分析、多维尺度分析等,其主要介绍研究者自行整理如表2-4所示。

表2-4 多元统计分析方法类别

①侯海燕.科学计量学知识图谱[M].大连:大连理工大学出版社,2008.②薛薇.SPSS统计分析方法及应用[M].北京:电子工业出版社,2013.

续表

①张晗,王晓瑜,崔雷.共词分析法与文献被引次数结合研究专题领域的发展态势[J].情报理论与实践,2007,30(3):378-380.

(二)词频分析法

词频分析法是利用能够揭示或表达文献核心内容的关键字或主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量方法。“由于一篇文献的关键字或主题词是文章核心内容的浓缩和提炼,因此,如果某一关键字或主题词在其所在领域的文献中反复出现,则可反映出该关键字或主题词所表征的研究主题是该领域的研究热点”[62]。词频分析方法的基本理论依据是美国学者G.K.齐普夫于20世纪40年代提出的词频分布定律,齐普夫在1935年对大量统计材料进行了系统的分析后提出了有关词频分布规律的齐普夫定律[63],其内容可以表述为:假设统计一篇较长文章中每个词出现的频次,并且按照前为高频词、后为低频词的顺序进行递减排列,再用自然数作为这些词的等级序号,即等级1是频次最高的词,等级2是频次次之的词……等级D为频次最小的词。如果频次以f来表示,等级序号以r来表示,则可以得出fr=C(C为常数)。

在科学计量学研究中词频分析法多用于学科领域的前沿研究,比如《开放课程热点问题研究——基于词频分析和共词聚类技术》[64]和《近十年国内外教师资讯化教学研究热点与发展趋势分析——基于知识图谱的词频分析》[65]就是运用该方法研究教育学领域中的开放课程和教师资讯化教学研究的热点问题。

(三)共词分析(Co-word Analysis)

共词分析方法的主要特点是强调关键字在文献计量研究中的作用,这种方法假设文献的关键字可以较准确地描述文献内容,概括多篇论文间的关系,而标志文献间的主题关联性的标志物即是两个关键字在同一篇文献中共同出现[66]。共词分析法属内容分析方法,共词分析法的基本原理是在同一篇文献中统计一组关键字或主题词两两出现的次数,再用聚类分析对次数结果进行分析,关键字之间的联系、亲疏程度可以呈现高频关键字的聚类结果,而共词分析中所涉及的词往往代表了某个学科和主题研究,因此通过分析这些词语的关系可以展现学科或者主题的结构变化。

(四)引文分析(Citation Analysis)(www.xing528.com)

中国科学计量学家邱均平认为引文分析是运用数学、统计学以及比较、概括、归纳等多种方法对期刊、论文、作者等研究对象进行关系研究,这里的“关系”即期刊、论文、作者之间的引用与被引用关系。引文分析是一种文献计量研究方法,它以展现各分析对象内部存在的数量特征和内在规律为特点[67]。其作用是从文献的引用频次中,反映文献之间的关联性、学科领域的引用特性以及文献作品与学科地位。科学引文与被引文之间往往有着学科内容上的联系。通过引文聚类分析,特别是对引文间的网状关系进行研究,能够探明有关学科之间的亲缘关系和结构,划定某学科的作者集体,分析推测学科间的交叉、渗透和衍生趋势,还能对某一学科的产生背景、发展概貌、突破性成就、相互渗透和今后发展方向进行分析,从而揭示科学的动态结构和某些发展规律[68]。在现实科学研究工作中,引文分析运用广泛,在诸如确定学科的影响及重要性、研究学科情报源分布、确定核心期刊、科学研究和信息传递规律、信息用户需求特征和评鉴学科与人才水平等领域都可以运用这种方法。

但是引文分析法也有一定的局限性,引文的篇数多寡不能视为品质的唯一标记,因为很少被引用的并不表示这篇论文品质就不高。所谓“科学睡美人”(sleeping beauties in science)就是这个现象,即指那些长期不被引用(10~20年休眠)然后突然成为高被引论文[69]。所以Egghe&Rousseau提出引文分析法结果解读的四项假设:(1)引用关系之文献在内容上具有某种程度的关联;(2)被引资料一定为作者所用;(3)引用资料表示对被引资料的肯定;(4)只有最好的作品才会被引用,是建立在行为认知上[70]

(五)共被引分析方法

共被引分析方法是由美国学者Small[71]与俄国学者Marshakova[72]分别在研究文献的引证结构与文献分类时提出的一种测量文献关系之间的分析方法,其目的在透过本文的参考文献引用,将文献之间所存在的引用关系加以计量与分析,用来揭示学科领域中研究主题的演进发展现状,乃至随着时间推移演进的趋势变化情况,形成所谓的知识演进议题间相关程度的集群或流派,用来探索学科领域中的研究前沿等。两篇文献构成共被引关系的条件是这两篇论文同时出现在第三篇文献的参考文献中。运用多元统计技术,如因子分析、聚类分析和多维尺度分析,可以按照共被引关系对某个学科领域的重要文献期刊进行分类,以确定学科研究主题的变化和发展模式。共引分析与其他主观性较强的方法如学者个体思考归纳、群体访谈调查相比较,其客观性科学性的优势显露无疑[73]。共被引分析可以分为以下几类:文献共被引分析(DCA)、期刊共被引分析(JCA)、作者共被引分析(ACA)、学科共被引分析(SCA)等,如表2-5所示。该方法不仅在资讯检索上具有相当大的效益,近年来亦被用于确认研究主题与研究前沿。

表2-5 共被分析方法类别

①White,Howard D.Author cocitation analysis and Pearson’s r[J].Journal of the Association for Information Science and Technology,2003,54(13):1250-1259.

(六)社会网络分析

社会网络分析(Social Network Analysis,SNA),也称为“结构分析”,是由社会学社会心理学的研究者在19世纪60—70年代创立的,它在发展过程中融合了数学、统计学及电脑科学等多种学科的分析方法。其主要内容是对研究对象的社会关系结构、社会关系属性进行分析,即分析的是不同社会单位个人、群体和社会所构成的关系的结构及其属性[74]。社会网络分析常用领域是衡量和描述行动者之间的关系,或经由这些关系所形成的,诸如信息、资源等东西。按照不同的着眼点,社会网络分析可以分为两种:关系取向(relational approach)和位置取向(positional approach)。关系取向关注行动者之间的社会性粘着关系,通过社会联结(social connectivity)本身如密度、强度、对称性、规模等来说明特定的行为和过程。位置取向则关注存在于行动者之间的,且在结构上处于相等地位的社会关系的模式化,它讨论的是两个或两个以上的行动者及其之间的关系所折射出来的社会结构,强调用结构等效来理解人类行为[75]

社会网络分析可以用某些网络模型来示意一些复杂多样的关系形态,然后根据网络模型和它们的变化来解释个人行动及社会结构的意义。以科学合作网络分析为例,想要判别某两位科学研究者之间存在或不存在接触合作,就要看他们是否共同发表过论文。社会网络分析理论的运用有以下几个前提条件:第一,行动者和行动是紧密联系的整体,其关系是彼此关联、彼此依存的;第二,信息和资源流转的途径是行动者相互之间的关联;第三,网络结构关系对行动者而言具有提供关联途径和限制行动范围的双重作用;第四,网络模型在把各种结构整合为概念的同时还转化为能体现行动者之间特殊关系的关系模型。吴斌、杜楠与裴欣提出运用社会网络分析进行定量研究时的主要指标包括度数、密度、捷径、距离、中心性、紧密型、中介性、桥、簇、团、凝聚子群分析等[76]。社会网络分析中运用的可视化技术可以把上述概念和分析指标直观图示化呈现,例如在文献研究中可以展现出具有重要影响的期刊、论文、作者以及机构等。

由上述说明可见,科学知识图谱融合了引文分析、社会网络分析、词频分析等多种文献计量法,该方法可以通过文献所承载的各种指标数据及其结构变化,来对某个学科领域或者研究主题的发展趋势进行深度揭示,如果依据时间规律对这些关系网络方面的变化进行分析,就可以找到预测学科发展变化动态趋向的依据。借助文献这种学术媒介,可以追溯学科活动、研究主题、研究流派、知识演进、研究前沿,以及运用其他学科知识,提供一项客观的佐证资料,因此本研究与过去相关研究最大之不同,除注意选择代表新闻传播学教育研究领域文献的对象范围和长达十五年的时间观察该学科教育研究演进外,还将引文分析、共被引分析作为了解学科教育研究主题演进的方法,以揭示该学科领域特性及演进情形。

本文将利用科学知识图谱的方法对中国新闻传播学教育研究的进展情况进行研究,并以视觉形象的图像、表格等直观地展示中国新闻传播学教育领域的代表人物、研究群体、科学合作网络的结构以及该学科教育研究的热点和趋势。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈