情感分析

简介
文本分类方法大部分使用基于模型的分类,基本上可以分为两大类:1)基于规则的分类方法,采用为类别集合的每个类别确定分类规则,然后根据类别模板统计待分类文本,确定该文本所属类别。基于规则的文本分类方法主要有:决策树、关联规则和粗糙集等;2)基于统计的分类方法,使用分类模型自动根据训练集中的信息自动学习,从而构造出文本特征和类别之间的对应关系模型,利用训练好的模型对待分类文本进行分类。基于统计的文本分类方法主要有:朴素贝叶斯、支持向量机、K均值等。


算法设计
情感分析架构图

这里写图片描述
图1 情感分析框架图


特定词提取
1) 连词


表1 连词及其关联权重

标识 关系类型 前句权重 后句权重 举例


评分计算
本文情感极性词汇库采用大连理工大学情感词汇本体,根据实际应用需求,对该词汇库进行补充与修正,同时引入连词规则以及否定词等进行辅助计算。


展望
本文算法目前采用基于规则的分类方法,通过引入关联规则(连词、否定词)对句子进行分析,计算出其情感倾向,进而引申至全文的情感倾向。从应用的角度,该方法能满足用户一般性需求。

posted @ 2018-10-08 11:52  张一清  阅读(321)  评论(0编辑  收藏  举报
友情链接:回力 | 中老年女装 | 雅思培训 | SAT培训 | 雅思和托福