首页 理论教育 Python中文文本分析:情感词典及赋分

Python中文文本分析:情感词典及赋分

时间:2023-11-06 理论教育 版权反馈
【摘要】:我们采用知网情感词典实现文本情感分析,2007年10月22日知网发布了情感分析用词语集,共有12个文件,包含中文情感分析用词语集和英文情感分析用词语集两类。“负面情感”词语,如哀伤、半信半疑、鄙视、不满意、不是滋味儿、后悔、大失所望等。其中,正面评价词语3730个,负面评价词语3116个,正面情感词语836个,负面情感词语1254个。表9-1程度级别词及其赋分

Python中文文本分析:情感词典及赋分

我们采用知网情感词典实现文本情感分析,2007年10月22日知网发布了情感分析用词语集(beta版),共有12个文件,包含中文情感分析用词语集和英文情感分析用词语集两类。

中文情感分析用词语集包含的6类词语如下:

(1)“正面情感”词语,如爱、赞赏、快乐、感同身受、好奇、喝彩、魂牵梦萦、嘉许等。

(2)“负面情感”词语,如哀伤、半信半疑、鄙视、不满意、不是滋味儿、后悔、大失所望等。

(3)“正面评价”词语,如不可或缺、才高八斗、沉鱼落雁、催人奋进、动听、对劲儿等。

(4)“负面评价”词语,如丑、苦、超标、华而不实、荒凉、混浊、畸轻畸重、价高、空洞无物等。

(5)“程度级别”词语,如很、较等。(www.xing528.com)

(6)“主张”词语。

其中,正面评价词语3730个,负面评价词语3116个,正面情感词语836个,负面情感词语1254个。为了便于对中文文本正面和负面情感极性分析,我们把正面评价词语和正面情感词语合并起来作为“正面”情感极性分析词语,把负面评价词语和负面情感词语合并起来作为“负面”情感极性分析词语。

在文本情感分析中我们对“正面”情感极性分析词语和“负面”情感极性分析词语分别赋予1和-1分值,也可以根据情感词的表达程度不同分别针对每个词赋予不同的分值。对程度级别词按照级别不同分别赋予不同的分值。如知网程度级别词包含如下6个类别,我们可根据级别不同分别赋予不同的分值,在本书中的赋分见表9-1。

表9-1 程度级别词及其赋分

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈