LakeLight

一步一个脚印

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

问题定义:

     观点(Opinion):观点是一个四元组(g, s, h, t),其中:g是观点针对的目标,s为情感倾向,正向、负向、中立会一个表示情感强度的浮点数,h为观点所有者,t为观点发表的时间。

    实体(Entity):实体可以是一个产品、服务、事件、主题、人或组织等。用一个二元组(T,W)表示,其中T为实体或实体的一个方面Aspect,W为T的属性。

    观点(Opinion):(e, a, s, h, t), 其中:e为观点针对的实体,a为实体的某个方面,s、h和t同上。

情感分析的任务:

    给定一篇文档,从中找出所有的观点元组(e, a, s, h, t),可以分解为下面几个子任务:

1,实体抽取以及实体分类

2,方面抽取以及方面分类

3,观点持有者抽取和分类

4,时间抽取和标准化

5,方面情感分类

6,观点元组生成

    示例:

(三星相机,画质,正向,John,2013-06-15)

(三星相机,电池,负向,John,2013-06-15)

(三星相机,整体,负向,John,2013-06-15)

    观点总结:观点都是主观的,只看一个人的观点没什么意义,需要对大量人的观点进行Summary。最简单的方式就是对某个实体的各个Aspect统计正向和负向情感数

    明确观点:如:可口可乐很好喝

    隐含观点:如:我昨天喝了一瓶可乐,今天拉肚子了

    客观语句:描述某种事实,如:Ipad是苹果公司的产品。客观语句也可能隐含某种情感倾向,如:这个车开了两天就坏了

    主观语句:描述人们的某种感觉和观点,如:Ipad真酷

    情感Emotion:是人们的某种感觉和思考。可分为:理智评价(Rational Evaluation)和情绪化评价(Emotional Evaluation),可用来em表明情感的强度,如

emotional negative –2

rational negarive –1

neutral 0

rational positive 1

emotional positive 2

posted on 2013-07-03 16:50  LakeLight  阅读(463)  评论(0编辑  收藏  举报