情感分析-读书笔记

针对这篇文章的读书摘要

《情感分析技术在美团的探索与应用》

https://tech.meituan.com/2021/10/20/the-applications-of-sentiment-analysis-meituan.html

 

我们对其所有用户评论分析后发现好评主要集中在口味、服务、性价比 等属性,但也有不少用户抱怨说咖啡厅的位置难找,不好停车,座位比较拥挤,空间 小等。

根据所处理文本的粒度,情感分析可以分为篇章 / 句子级情感分析和属性级情 感分析 [4],与属性级情感分析密切相关的还有观点三元组分析。

这种任务学术上被称为 ABSA(Aspect Based Sentiment Analysis,基于属性的情感分析),可以划分为 ACSA(Aspect Category Senti- ment Analysis,基于属性类别的情感分析)和 ATSA(Aspect Term Sentiment Analysis,基于属性项的情感分析)[5],其中 ACSA 是识别在相应预定义属性类别
(Aspect Category)上的情感倾向,如上述评论在属性类别“菜品口味”上表达正向 情感,在属性类别“服务态度”上表达负向情感。ATSA 中是识别针对文本中出现的 相应属性(Aspect Term)的情感倾向,如上述评论中针对属性“饭菜”表达正向情感, 针对属性“服务员”表达负向情感。本文所述属性级情感分析主要指 ACSA 任务。

观点三元组分析包括属性抽取(Aspect Extraction)、观点抽取(Opinion Extraction) 以及属性 - 观点对(Aspect-Opinion)的情感倾向分析三个任务,在学术上称为 Aspect Sentiment Triplet Extraction[6] 或者 Opinion Triplet Extraction[7]。属性抽 取和观点抽取属于信息抽取的范畴,属性 - 观点对的情感倾向分析属于分类任务。

为了建立精准的情感分析能力,在数据标注时我们将情感强度划分为离散的七 档评分——[ 非常负向 , 负向 , 轻微负向 , 中性 , 轻微正向 , 正向 , 强烈正向 ],并采用 Min-Max Normalization 将标注 Label 归一化到 [0 ~ 1]。
View Code

 

2018 年以来以 BERT 为代表的预训练模型在多项 NLP 任务中 取得巨大进展,BERT 在特征抽取上具有较强优势,如浅层的句法特征以及深层的语 义特征。

如图 7(a)所示,美团 App 和大众点评 App 首页信息 流文案大部分抽取自用户真实评论,需要从内容供给上严格控制文本质量,通过句子 级情感分析对供给内容中的负向内容进行过滤,提升终端用户体验。此外,在商业智 能场景中,句子级情感分析还可以帮助商家优化运营策略,如图 7(b)所示,美团商 业大脑通过情感分析能力可以监控用户对商家评价的情感曲线以及评论情感占比等指 标来改善商家运营。
View Code

 

 

 

标注人员需要先判断预定义的 属性是否在该评论中被提及,再判断被提及属性上的情感倾向。因此对于每个属性共 有 4 种标签——[ 未提及 , 负向 , 中立 , 正向 ]。 

 

 

 

posted @ 2022-02-13 22:00  blcblc  阅读(95)  评论(0编辑  收藏  举报