微博情感分析可用于异常或突发事件的监测
利用该分类器,研究小组对收集到的发布于2011年的近7000万条微博进行情感分析,根据各类情绪比例的波动,他们提出一个快速的异常点发掘算法,并发 现2011年全年发生的一些典型的异常或突发事件,均可以被有效地检测出来,甚至可以观察事件带来影响的持续时间等,有效地论证了基于微博情感理解实现事 件监测的可信性。如下图示,其中以A-I标记了检测出的top-10异常点(天)。如F对应新年,以高兴的情绪为主;G,I对应春节,也以高兴的情绪为 主;而A、D、E则对应动车事故,明显看到用户以低落悲伤的情感为主,同时愤怒的情绪比例也明显上长升至全年最高;C、B和J对应日本3月份的地震,以低 落的情绪为主,但对J点,即2011年03月17日,愤怒的情感比例突然增加,这与当时的盛传碘盐被污染、盐荒等谣言有关;H对应苹果前CEO乔布斯逝 世,以低落的情绪为主,但同时,愤怒的情绪比例极低,与前面的动车事件和碘盐谣言有明显的区别。
同时,他们亦对新浪微博用户的一些情感波动模式进行了观察,如下图示,有趣的是,他们发现早上6:00到7:00之间用户情绪最为低落,主要原因是“不愿起床”或“不想上班”。
该小组亦开发了实时监测系统,以30分钟为周期,不间断地对新浪微博情感变化进行实时跟踪和监测,如下图示,为2012年起始至今的波动曲线及一些异常点对应的事件。有趣的是,因为新浪评论功能的短暂关闭,用户情绪中厌恶的比例曾出现罕见地上升。
据悉,该研究小组已公开他们的初步应用系统MoodLens,可以通过访问http://gana.nlsde.buaa.edu.cn/hourly_happy/moodlens.html进行使用。稍后,他们将会陆续对大学等研究机构免费公开所使用的微博情感标注语料库和其他相关数据集。