首页 理论教育 情感分析过程-基于语义网的个性化网络学习服务

情感分析过程-基于语义网的个性化网络学习服务

时间:2023-11-26 理论教育 版权反馈
【摘要】:情感分析包括一系列的复杂处理过程中,主要包括分句、分词、语义相似度计算、语义倾向计算、情感补偿和评论情感倾向计算六个步骤,下面是每个步骤的详细描述。语义相似度计算对于w1和w2两个词语,记Sim为其相似度,Dis为词语语义距离,则和Sim和Dis存在下列对应关系:Dis和Sim成反向关系,即Dis越大,则Sim越小:为0时,Sim为1,表示两个词语完全相似;当Dis为无穷大时,Sim为0,表示两个词语完全不相似或不相关。

情感分析过程-基于语义网的个性化网络学习服务

情感分析包括一系列的复杂处理过程中,主要包括分句、分词、语义相似度计算、语义倾向计算、情感补偿和评论情感倾向计算六个步骤,下面是每个步骤的详细描述。

(1)分句

根据标点符号分句,包括“,”、“;”和“。”号。

(2)分词

采用汉语词法分析系统ICTCLAS,其主要功能包括中文分词,命名实体识别,词性标注,新词识别,同时支持用户自定义词典。

(3)语义相似度计算

对于w1和w2两个词语,记Sim(w1,w2)为其相似度,Dis(w1,w2)为词语语义距离,则和Sim(w1,w2)和Dis(w1,w2)存在下列对应关系:Dis(w1,w2)和Sim(w1,w2)成反向关系,即Dis(w1,w2)越大,则Sim(w1,w2)越小:为0时,Sim(w1,w2)为1,表示两个词语完全相似;当Dis(w1,w2)为无穷大时,Sim(w1,w2)为0,表示两个词语完全不相似或不相关。

两者之间的对应关系如公式所示:

其中,α为调节因子。

由于词汇相似度计算方法在区分词的情感倾向上还不理想,因此江敏等提出了一个新的相似度计算方法,考虑了词在概念树中的层次,认为两个词虽然距离相同,但是如果位于的层次越深,相似度越大,具体如下:

其中w1,w2表示两个概念,depth(w1)表示w1距离根节点的层次,Dis(w1,w2)表示它们的路径长度,α是一个调节参数,表示深度对相似度计算影响的大小。(www.xing528.com)

(4)语义倾向性计算

确定了计算词汇之间的相似度的方法后,对于任意一个词即可根据该词与两组基准词的语义关系紧密程度,通过计算得到语义倾向性度量值。两组基准词由人工选取,每个词都有明确的倾向性,一组表达正面情感,一组表达负面情感。下列公式的结果可作为一个倾向性度量,其中seed1表示正面基准词组,seed2表示负面基准词组,两组基准词的个数分别为n,m:

如果结果为正,则表示该词为褒义,如果结果为负,则表示该词为贬义。

(5)情感补偿

构建修辞辞典,根据修饰词语气强度对语义倾向性计算结构进行补偿:

其中分别表示修饰词1和修饰词2的语义强度。

(6)评论情感倾向计算

一条评论被分为sen1,sen2,…,senk个句子,首先对每个句子计算其情感倾向:

然后计算整个评论的情感倾向:

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈