文本情感分析综述
摘 要:在社交网络、在线评论平台的流行下,文本情感分析成为学术界和业界聚焦的热点领域。通过文献调研的方式,对文本情感分析进行综述。首先,从时间、方法等维度对情感分析进行文献调研;其次,对文本情感分析所涉及的核心概念进行阐述;然后,将文本情感分析的方法分为基于情感字典、基于传统机器学习和基于深度学习三类,分别对这三类方法进行总结归纳,并分析每类方法的优缺点。最后,对该领域的未来研究进行展望。
关键词:情感分析;情感词典;机器学习;深度学习
Review of Text Sentiment Analysis
Abstract: With the popularity of social networks and online review platforms, text sentiment analysis has drawn attention in both academia and industry. A review of text sentiment analysis is conducted by means of literature research. Firstly, literature research on sentiment analysis in terms of time and methods is conducted. secondly, the core concepts in text sentiment analysis is explained. Then, classify the methods of text sentiment analysis into three categories: method based on sentiment dictionaries, method based on traditional machine learning and method based on deep learning, summarize these three categories of methods respectively, and analyze the advantages and disadvantages of each methods. Finally, the future research in this field is prospected.
Key word: Sentiment Analysis , Sentiment Dictionary , Machine Learning , Deep Learning
1 引言
分析观点的科学早在20世纪初期就已经出现,当时公众观点的收集、分析和量化均通过调查问卷进行。社交媒体和在线评论平台的流行导致了“情感分析”这一研究领域的出现,以分析海量的非结构化在线意见资源。
情感分析,又称趋向性分析或意见挖掘,是通过分析文本、声音和图像来提取人们的观点、意见、态度和情感,从而从用户的意见中提取信息的过程(陈龙etal.,2017)。如今,社交媒体上的任何事件都可以在瞬间被发布、查看、评论和分享,数百万人可以参与其中。中国互联网络信息中心(CNNIC)发布的第50次《中国互联网络发展状况统计报告》显示,截至2022年6月,中国共有10.51亿网民,互联网普及率达74.4%。在网络视频(包括短视频)、网络购物和网络新闻三类互联网应用中,有超过7.8亿用户使用,占网民的70%以上(中国互联网络信息中心,2022)。在当前的大数据时代,情感分析可以成为帮助人们理解和应对事件的重要工具。情感分析不仅成为学术界的研究重点,在工业界也有很多应用和发展前景。当然,情感分析的流行源于其广泛的应用。政府部门可以从社交网络平台上收集人们对社会新闻的评论,以了解民意,从而帮助监督舆论和调整政策;企业可以从在线评论平台和公共论坛上收集人们对其品牌和产品的评论,以更好地了解客户心理和意见,为企业寻求更广泛的市场和利润;消费者可以从在线购物平台上获得对产品的反馈,从而帮助他们买到更合适和满意的产品。
2 情感分析相关概念
情感分析的目的是分析文本中表达或蕴含的积极(肯定)、消极(否定)或中立情感。文本的情感分析按规模可分为三类:篇章级情感分析、句子级情感分析和属性级情感分析。其中,篇章级和句子级情感分析被视为粗粒度情感分析,而属性级情感分析被视为细粒度情感分析。
篇章级和句子级情感分析的目的是判断整个文本或句子的情感倾向。篇章和句子级的情感分析需要一个模型来确定特定文本的整体情感强度或情感倾向。根据模型的输出类型,有回归和分类两类方法。回归方法的结果是连续的情感强度[0,1],其中0倾向于消极,1倾向于积极,而分类方法的结果是离散的情感极性(积极、消极或中立)。对于这项任务,主要的技术方法是TextCNN、Att-BiLSTM和以BERT为代表的预训练模型。Att-BiLSTM提出使用注意力机制从句子中提取最相关的信息,并在学习长距离语义方面优于TextCNN。
针对篇章级和句子级情感分析的研究相对较早且比较成熟,但面对复杂语句时,分析的结果并不理想。如”酒店装潢华贵,设施也很齐全,但缺少停车位,服务员也不够礼貌”这句话,很难确定整个句子的情感极性。为了获得更完整和准确的情感信息,就需要以更精细的粒度确定属性层面的情感,即属性级情感分析(Aspect Based Sentiment Analysis,ABSA)。
属性级情感分析与篇章和句子级的情感分析不同,因为目标信息和相对应的情感都必须被考虑在内。一般情况下,细粒度情感分析可以分为三个步骤进行:识别评论对象的属性及其对应的情感词;对识别出的对象属性的情感进行极性分类;汇总分类结果(唐晓波and刘广超,2017)。
目前,在解决属性级别情感分析问题的绝大多数工作都集中在注意力机制的设计上,以此突出上下文和属性词中不同词对于属性级别情感分析的贡献,同时使上下文和属性词之间相互关联。冯超等(2021)提出使用层次注意力机制和门机制处理属性级别情感分析任务,在得到属性词的隐藏状态之后,通过注意力机制得到属性词新的表示,然后利用属性词新的表示和注意力机制进一步得到上下文新的表示,层次注意力机制的设计使得上下文和属性词的表达更加准确;同时通过门机制选择对属性词而言上下文中有用的信息,以此丰富上下文的表达。Xu等(2020)提出了一种新的基于图卷积网络(GCNs)的模型,明确定义了句子和属性的节点来学习句子和属性的表征,然后结合4种关系来构建异构图,从而充分挖掘句子的潜力和GCNs强大的特征融合能力。
3 文本情感分析方法
3.1 基于情感词典的文本情感分析
基于情感字典的方法是指使用情感字典来提取文档中情感词的情感值,然后用加权计算确定文档的整体情感倾向。这类方法的核心是构建情感字典。情感词典是基于先验知识的、人工标注的知识库,词典中的每个词都被赋予不同的情感值(易顺明etal.,2016)。然而,这种方法没有考虑到词与词之间的关系,并且词语的情感值不会因文本的上下文和使用场景而改变。因此,为了提高分类的准确性,就需要对每个特定领域的创建其所对应的情感字典。
英文情感词典起步较早,目前主流的英语情感词典有General Inquirer、Linguistic Inquiry and Word Count、MPQA和SentiWordNet(Deng et al, 2017)。中文情感词典中应用较广的有知网词典HowNet和大连理工大学的中文情感词汇本体库。
情 感 词 典 可 以 手 工 构 建 , 也 可 以 通 过 种 子 词 扩 展 单 词 列 表 的 方 式 来 自 动 构 建(Hatzivassiloglou and Mckeown, 2002; Turney, 2002; Turney and Littman, 2003)。Taboada等(2011)手工构建了语义倾向计算器(SO-CAL),这是一个带有语义注释 (极性和强度)的词汇,并增加了增强语气词和否定词。基于SO-CAL的方法在解决情感极性 分类的问题上能够取得良好的效果。刘若兰和杨建平(2022)在Word2Vec的基础上,从以前编制 的维吾尔族情感词典中自动扩展了情感词。
上述研究主要是针对单语文本的情感分析,但随着多语言混合或纯英文表达方式在中国社交网络平台上逐渐流行,需要新的方法来应对这种新情况。栗雨晴等(2016)提出了一种基于双语词库的多类别情感分析方法,利用现有的知识库、大型语料库和词汇相似度计算模型,建立了英汉双语情感词库,然后对微博文本进行矢量处理,分析多类别语义趋势,更准确、高效地捕捉群体意见,能够及时发现一段时间内的社会舆论趋势。
基于情感词典的分析方法是稳健的,具有良好的跨领域性能,并且可以很容易地使用多种知识源进行完善。然而,它也有以下缺点。
1.跨语言的应用很难实现。不同的语言有不同的语法、语义和表达特征,它们创建和提取情感词汇和特征的方式也不同,所以不可能用简单的方法来创建新的情感词典,比如把现有的情感词典翻译成另一种语言。
2.需要很高的人工注释开销。英文情感词典SentiWordNet3.0.0版包含了117659条记录,再加之语言是流动的,旧词的意义变迁、新词的诞生,都会给情感词典的维护带来困难。
3.多目标情感分类任务是复杂和具有挑战性的。传统的情感词典对于多目标情感分类问题可能无法取得与一般情感分类问题相同的结果。一句话中往往有多个目标,多个目标的情感可能一致,也可能不一致。然而,在现有的测试集中,通常每句只有一个目标,而在有多个目标的句子中,多个目标的情感倾向分布不均。数据集本身的不足限制了完善模型以对多目标进行情感分类的可能性。为了解决这个问题,刘鹏远等(2021)构建了一个用于多目标情感分类的中文数据集,实现了评价目标数量分布、正面和负面情感的极性分布以及多目标情感趋势分布之间的平衡。然而,实验表明,现有的主流模型不能对存在多个目标且目标情感倾向性不一致语句中的目标进行很好的分类,特别是当目标的情感倾向为中性时。
3.2 基于传统机器学习的文本情感分析
基于机器学习的文本情感分析方法的主要思想是训练一个分类器,将带有情感标签的数据作为分类器的输入,输出测试集中文本的情感倾向。
基于机器学习的方法可以分为有监督学习、无监督学习和半监督学习三类。有监督学习是基于手工标注的情感特征作为先验知识来训练模型,实现对新文本的情感极性判断。目前,大多数基于有监督学习的研究都取得了不错的成绩(唐慧丰etal.,2007),但是由于有监督学习依赖于大量手工标注的数据,使得有监督学习的方法需要付出很高的人工代价。与之相反,无监督学习无需手工标注数据就能够训练模型,能够极大降低标注的人工成本,但由于其完全依赖机器学习结果,效果难以达到预期。而半监督学习则是有监督学习和无监督学习的一种折中方案,其能够综合利用少量已标注样本和大量未标注样本来提高模型的学习性能,同时兼顾了人工成本和训练效果。
在基于机器学习的早期研究中,研究者尝试将情感分析简单地视为基于主题的分类(这两个主题分别是积极情感和消极情感),使用朴素贝叶斯、最大熵分类法和SVM,但无法达到与标准的基于主题的分类相媲美的成绩(Pang,2002)。QiangYe等(2009)比较了Na¨ıveBayes、SVM和基于字符的N-gram模型这三种有监督的机器学习算法,对美国和欧洲七个热门旅游目的地的旅游博客评论进行情感分类。实验发现,SVM和N-gram方法的表现优于Na¨ıveBayes方法,当训练数据集有大量评论时,这三种方法的准确率都达到了至少80%。
尽管基于传统机器学习的方法在一些情感分析问题中的准确率足以令人满意,但它始终无法突破一些语言学现象。在文本中普遍出现“整体不等于部分的总和”这一现象,许多词所表明的含义与整个评论的情绪相反。在这些例子中,人类可以很容易地检测出评论的真实情绪,但是分类器可能会发现这些情况很困难。
3.3基于深度学习的文本情感分析
深度学习是机器学习的一个分支学科,其思想是模仿人脑的神经网络来学习和解释数据。随着深度学习方法被成功应用于计算机视觉和语音识别,深度学习方法也越来越多地被应用至自然语言处理领域。
在使用深度学习方法训练神经网络模型时,通常使用词向量来表示词语作为神经网络的输入。例如,用向量[0.10.20.3]T表示”情感”,用向量[0.40.50.6]T表示”分析”,用这种低维实数向量表示词语,避免了数据维度的灾难。词向量表示在深度学习中得到了广泛的应用,并优于传统的词袋模型。然而,Wang等(2021)指出,语义空间的词向量表示和情感空间的情感表征存在区别,情感空间的情感表征比语义空间的词向量更能表达情感关系。
目前基于深度学习的文本情感分析模型包括卷积神经网络(CNN)、递归神经网络(RNN)、LSTM、Transformer、Bi-LSTM、门控循环单元(GRU)和注意力机制等。在实际的情感分析研究中,研究人员经常会对这些主流的深度学习模型进行改进和融合,以更好地处理具体的情感文本数据。
CNN和RNN在自然语言处理中被广泛使用,但由于自然语言结构的前后依赖性,仅基于卷积神经网络的文本分类没有考虑到单词的上下文含义,而传统的递归神经网络存在梯度分解或梯度分割的问题,限制了文本分类的准确性。为此,李洋等(李洋and董红斌,2018)提出了卷积神经网络和双向长短时记忆(Bi-LSTM)的特征融合模型,利用卷积神经网络提取文本向量的局部特征,利用Bi-LSTM提取与文本上下文相关的全局特征,并将两个互补模型提取的特征结合起来,解决了卷积神经网络的一个模型忽略了词的上下文语义和句法信息的问题。这也有效地克服了传统的递归神经网络中的梯度损失或梯度分散的问题。
递归自编码网络(RAE)模型利用哈夫曼树型网络将多维矩阵信息编码为矢量,用于语义信息提取和合成。与RNN和CNN相比,它在处理具有复杂语法规则的句子方面有很大优势,可以更好地理解句子的语法结构(朱引and黄海燕,2018)。梁军等(2014)针对中文文本中频繁的情感转移现象,提出了一个基于RAE的情感极性转移模型。该模型采用递归神经网络来检索任务相关的特征,并采用基于句子-单词相关性的情感极性转移模型来提高对文本相关性的感知,从而提高深层语义的情感分析。
递归神经网络的长短时记忆(LSTM)架构自1995年推出以来已被广泛用于语言建模、机器翻译、语音识别等领域。LSTM架构的基本思想是一个状态不随时间变化的存储单元,以及一个调节信息流进出存储单元的非线性门控单元(Greffetal.,2016)。Graves等(2013)将LSTM模型应用到电话号码识别任务,突破了在TIMIT测试集的最低误差。然而,由于LSTM的架构是一种链式结构,不能有效地描述语言的结构层次信息,梁军等(2015)将LSTM扩展为基于树的递归神经网络,从文本中提取更深层次的语义-语法信息,并根据句子前后的关联性引入情感极性转移模型。实验表明,这项工作中提出的模型优于LSTM、递归神经网络。
4 总结与展望
本文通过文献调研的方式综述了国内外在文本情感分析领域的研究方法及成果,对文本情感分析所涉及的核心概念进行阐述,对文本情感分析的三类方法进行总结归纳,并分析其优缺点。针对文研究现状,提出以下几个值得关注的方向。
1.情感强度、情感类型的细粒度划分。现在绝大多数的研究工作聚焦于分析出文本中的两种或三种情感极性,即积极、中立和消极。这种基于情感极性的划分固然对实际决策有指引作用,但不够明确,无法让决策者理解应执行到怎样的程度和具体方向。因此,对情感强度、情感类型进行更细粒度的划分是有很大研究必要和应用前景的。例如,在情感强度方面,积极情感可以进一步划分为轻度的“感兴趣”、中度的“喜欢”和重度的“热爱”,而在情感类型方面,积极情感包含高兴、感激等,消极情感包含愤怒、悲伤、恐惧等。当然,对情感类型的细粒度划分难免存在主观偏见,这可能对数据采集和结果评定造成一定困难。
2.结合语言特征,融合语言学知识进行更多扩展。例如,汉语中的重叠现象丰富,文本情感分析任务中应该关注篇章内的重叠现象和句子间的照应关系(娜仁图雅and徐晓音,2020)。
3.基于显性文本的情感分类已经取得了丰富的研究成果。然而,对文本中隐含的情感的研究仍处于起步阶段。隐性情感文本是指不包括情感词但却隐含情感倾向的文本。DonghangPan等(2019)建立了基于DNN、LSTM、Bi-LSTM、CNN和基于注意力的分类模型来判断用户隐性情感文本的倾向性,实验发现,LSTM、CNN和Bi-LSTM基本分类模型都取得了比DNN更好的效果,但由于没有情感词,基于注意力机制的分类模型没有得到明显改善。隐形情感文本的分类往往比显性情感文本的分类任务更加困难。
4.深度学习方法中神经网络模型的可解释性。这不仅是情感分析领域的难题,更是深度学习发展至今需要突破的方向。这种不易解释性一方面体现在神经网络特征和逻辑在语义层面难以理解,另一方面体现在缺少科学工具去评估网络的特征表达能力,如泛化能力、收敛速度、所包含的知识量等。提高神经网络模型的可解释性,可以给语言学、语义学等领域提供更多指导方向。
参考文献
Qiang Ye A B, Ziqiong Zhang A, and Rob Law B. 2009. Sentiment classification of online reviews to travel destinations by supervised machine learning approaches - sciencedirect. Expert Systems with Applications, 36(3):6527–6535.
Shuyuan Deng, Atish P. Sinha, and Huimin Zhao. 2017. Adapting sentiment lexicons to domain-specific social media texts. Decision Support Systems, 94:65–76.
A. Graves, A. R. Mohamed, and G. Hinton. 2013. Speech recognition with deep recurrent neural networks. In IEEE International Conference on Acoustics.
K. Greff, R. K. Srivastava, J Koutn´ık, B. R. Steunebrink, and J. Schmidhuber. 2016. Lstm: A search space odyssey. IEEE Transactions on Neural Networks Learning Systems, 28(10):2222–2232.
V. Hatzivassiloglou and K. R. Mckeown. 2002. Predicting the semantic orientation of adjectives. Proceedings of the Acl.
D. Pan, J. Yuan, L. Li, and D. Sheng. 2019. Deep neural network-based classification model for sentiment analysis.
Bo Pang. 2002. Thumbs up? sentiment classification using machine learning techniques. Proc. EMNLP, 2002.
Maite Taboada, Julian Brooke, Milan Tofiloski, Kimberly D. Voll, and Manfred Stede. 2011. Lexiconbased methods for sentiment analysis. Computational Linguistics, 37(2):267–307.
Peter D. Turney and Michael L. Littman. 2003. Measuring praise and criticism : inference of semantic orientation from association.
Peter D Turney. 2002. Thumbs up or thumbs down? semantic orientation applied to unsupervised classification of reviews. Association for Computational Linguistics.
Xiangyu Wang and Chengqing Zong. 2021. Distributed representations of emotion categories in emotion space. In Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers), pages 2364–2375. Association for Computational Linguistics.
K. Xu, H. Zhao, and T. Liu. 2020. Aspect-specific heterogeneous graph convolutional network for aspect-based sentiment classification. IEEE Access, 8:1–1.
中国互联网络信息中心. 2022. 第50次中国互联网络发展状况统计报告. 电子学报.
冯超, 黎海辉, 赵洪雅, 薛云, and 唐婧尧. 2021. 基于层次注意力机制和门机制的属性级别情感分析. 中文 信息学报, 035(010):128–136.
刘若兰and 杨建萍. 2022. 基于word2vec的维吾尔语情感词典扩展研究. 信息与电脑.
刘鹏远, 田永胜, 杜成玉, and 邱立坤. 2021. 多目标情感分类中文数据集构建及分析研究. 中文信息学报, 35(6):9.
唐慧丰, 谭松波, and 程学旗. 2007. 基于监督学习的中文情感分类技术比较研究. 中文信息学报, 21(6):88–94.
唐晓波and 刘广超. 2017. 细粒度情感分析研究综述. 图书情报工作, 61(5):9.
娜仁图雅and 徐晓音. 2020. 文本情感分析中的重叠现象研究. In Proceedings of the 19th Chinese National Conference on Computational Linguistics.
易顺明, 周洪斌, and 周国栋. 2016. Twitter推文与情感词典sentiwordnet匹配算法研究. 南京师范大学学 报:工程技术版, 16(3):8.
朱引and 黄海燕. 2018. 基于主题增强的递归自编码情感分类研究. 计算机科学.
李洋and 董红斌. 2018. 基于cnn和bilstm网络特征融合的文本情感分析. 计算机应用, 38(11):29–34.
栗雨晴, 礼欣, 韩煦, 宋丹丹, and 廖乐健. 2016. 基于双语词典的微博多类情感分析方法. 电子学报, 44(9):6.
梁军, 柴玉梅, 原慧斌, 昝红英, and 刘铭. 2014. 基于深度学习的微博情感分析. 中文信息学报, 28(5).
梁军, 柴玉梅, 原慧斌, 高明磊, and 昝红英. 2015. 基于极性转移和lstm递归网络的情感分析. 中文信息学 报, 29(5):152–160.
陈龙, 管子玉, 何金红, and 彭进业. 2017. 情感分类研究进展. 计算机研究与发展, 54(6):21.