首页 理论教育 高频词统计及语义分析

高频词统计及语义分析

时间:2023-08-15 理论教育 版权反馈
【摘要】:表1非索引类期刊发表索引论文的高频词汇总表续表在表1高频词汇统计基础上,对构建网络和共词矩阵的高频词进行参数设置,进而生成如图8所示的“索引研究论文语义网络图”。通过对高频词和语义网络图进行分析,我们还能够发现非索引类期刊发表的索引研究论文所具有的一些新特点。

高频词统计及语义分析

将323篇索引研究论文的题目信息,导入ROST Content M ining内容分析工具中,通过分词和词频分析,提取出高频词,再过滤并剔除无意义词后,得到如表1所示排名最前的高频词统计汇总表。

表1 非索引类期刊发表索引论文的高频词汇总表

续表

在表1高频词汇统计基础上,对构建网络和共词矩阵的高频词进行参数设置,进而生成如图8所示的“索引研究论文语义网络图”。通过对高频词和语义网络图进行分析,我们还能够发现非索引类期刊发表的索引研究论文所具有的一些新特点。

图8 非索引类期刊发表索引论文的语义网络图(www.xing528.com)

在研究对象方面,非索引类期刊发表的索引研究论文几乎涵盖了索引研究的方方面面,从古籍索引编纂到现代索引数据库建设,都进行了有益的探讨、思考、评价等。“索引”是排名第一的高频词,处于语义网络的中心,并与“编制”“中国”“引文”“数据库”“古籍”“文献”“检索”“学术”等70个热词产生语义关联。“研究”是排名第二的高频词,与“编制”“文献”“检索”等9个热词产生语义关联,且两者在共词矩阵中的共有词汇大多相同,这表明非索引类期刊发表的论文,以研究索引编制、数据库、古籍等主题为主,从现象探索本质,寻找规律,以促进索引学科体系的发展与完善。

从研究内容来看,“编纂”“方法”“发展”等排名前30位的热词,都与“索引”一词产生语义关联,这一状况也和我国目前的普通中文图书九成以上缺少书后索引相吻合,探讨索引编制,快速普及索引知识,促进索引事业发展,是索引研究的重中之重。具体来说,需要加强索引编制方法的多方面探讨,提高索引的功能性和应用性,以此促进索引的普及和推广。

从研究目的来看,加强索引的普及和提高索引编制的经济效益与社会效益,进而促进索引的社会服务深度和广度,是目前我国索引编制和索引研究的主要任务。“功能”一词作为排名前20的热词,在语义网络图中构成了一个重要的节点,此外“应用”“建设”“作用”“实践”等作为排名前40的热词,与排名前10的“引文”“数据库”“编制”等高频词产生语义关联,说明在数字出版环境影响下,索引研究重点在关注索引编制过程和索引产品数字化,期望的效果是技术与内容相互融合式的发展。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈