中文情感分析 Sentiment Analsis
分析对象:iphone5s的手机评论。
来源:京东,亚马逊,中关村等
情感分析:
step1:确定一个词是积极/消极,主观/客观。依赖来源词典
词典资源: 英国SentiWordNet(准确), Hownet,NTUSD ,还有大连理工发布的情感词汇本题库
step2:识别一个句子是消极/积极,主观/客观
匹配一个句子中有词典中的那些词,然后加总计算句子情感分值。不同领域有不同的情感词,需要根据具体领域构建针对性的情感词典,也可以使用有监督的机器学习方法,把 一堆评论进行算法训练,训练出区分主客观评论的分类器。积极、消极可以直接进行标注星级等级;机器学习判断主客观有点困难。
Pytho的SnowNLP可以计算一句话的积极消极情感值(推荐)
step3.情感挖掘升级为意见挖掘
从评论中找到属性,然后看评论是如何评论属性的。即在情感分析的基础上,先挖掘出产品属性,再分析对应属性情感。分析完每一条属性情感后,进行汇总。形成消费者对 一款产品各个部分的评价。可以对比不同产品的评价进行可视化。
关键点:找到评论中的主观句子,在句子中使用关联规则挖掘产品属性,准确分析对应的情感倾向与情感强度。计算属性对应的情感值。情感分析很重要。
Bing Liu:sentiment Analysis and opinion Mining (http://www.morganclaypool.com/doi/abs/10.2200/s00416ed1v01y201204hlt016)
Bo Pang:Opinion Mining and Sentiment Analysis (http://dl.acm.org/citation.cfm?id=1454712)