首页 理论教育 Python中文文本分析:情感分析概述及分类方法实现

Python中文文本分析:情感分析概述及分类方法实现

时间:2023-11-06 理论教育 版权反馈
【摘要】:“离市区大概15公里,大部分进去的都是团客,有各种水上项目,不过收费高,里面只是看看石头,各种石头,第一次去三亚的可以去看看。”因此,对于情感分析中的情感极性判断实际上是属于分类问题,可采用文本分类方法实现。

Python中文文本分析:情感分析概述及分类方法实现

有研究人员通过对著名社交网站Twitter中的用户情感分析发现,采用情感分析技术获得的用户情感变化结果和采用传统的调查、投票等方法获得的结果有高度的一致性,还有研究通过Twitter用户情感分析预测股票走势、电影票房和选举结果等,均是将公众情绪与社会事件对比,发现一致性并用于预测。这些研究表明,对于用户个人在线主观评论信息的情感分析,能够比较准确有效地反映公众对评论对象的观点和看法,为各级管理方提供决策支持信息。因此,通过海量用户在线评论信息可以有效反映此类文本数据的情感分析,获得用户的情感倾向,能够为政府部门的舆情监控、企业经营策略的制定和服务质量的提高等方面提供可靠的依据。

情感分析是对文本包含的情感极性进行判断,而情感极性可以分为正面和负面两类,也可以分为正面、负面、中性三类。其中正面表示一种积极、高兴等情绪,负面则表示消极、悲观等情绪。如我们获取了三亚“天涯海角”景区的几条在线评论文本,其情感极性如下:

(1)“天涯海角真的挺美的,一点也不像他们说的就几块石头,海水很清澈,有专业婚纱拍摄基地,是拍婚纱的好地方。”

(2)“来三亚的这几天这样的享受,快乐的时光总是很短暂的,我们去的南山寺很漂亮,到处是美景,流连忘返,108米高的南海观音佛像很震撼,天涯海角中段的沙滩沙子柔软,客服金牛推荐的这个团的确是没有购物和自费,蛮好的,下次出游还选择这种方式。”(www.xing528.com)

(3)“离市区大概15公里,大部分进去的都是团客,有各种水上项目,不过收费高,里面只是看看石头,各种石头,第一次去三亚的可以去看看。”

(4)“差评,沙子脏,人多,不好玩。”

其中,景点评论(1)和(2)的情感极性为正面。评论(3)和(4)的情感极性为负面。因此,对于情感分析中的情感极性判断实际上是属于分类问题,可采用文本分类方法实现。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈