情感分析

简介
文本分类方法大部分使用基于模型的分类，基本上可以分为两大类：1）基于规则的分类方法，采用为类别集合的每个类别确定分类规则，然后根据类别模板统计待分类文本，确定该文本所属类别。基于规则的文本分类方法主要有：决策树、关联规则和粗糙集等；2）基于统计的分类方法，使用分类模型自动根据训练集中的信息自动学习，从而构造出文本特征和类别之间的对应关系模型，利用训练好的模型对待分类文本进行分类。基于统计的文本分类方法主要有：朴素贝叶斯、支持向量机、K均值等。

算法设计
情感分析架构图

这里写图片描述
图1 情感分析框架图

特定词提取
1）连词

表1 连词及其关联权重

标识关系类型前句权重后句权重举例

评分计算
本文情感极性词汇库采用大连理工大学情感词汇本体，根据实际应用需求，对该词汇库进行补充与修正，同时引入连词规则以及否定词等进行辅助计算。

展望
本文算法目前采用基于规则的分类方法，通过引入关联规则（连词、否定词）对句子进行分析，计算出其情感倾向，进而引申至全文的情感倾向。从应用的角度，该方法能满足用户一般性需求。

posted @ 2018-10-08 11:52 张一清阅读(321) 评论(0) 编辑收藏举报

刷新页面返回顶部

张一清

情感分析

公告