情感分析-读书笔记
针对这篇文章的读书摘要
《情感分析技术在美团的探索与应用》
https://tech.meituan.com/2021/10/20/the-applications-of-sentiment-analysis-meituan.html

我们对其所有用户评论分析后发现好评主要集中在口味、服务、性价比 等属性,但也有不少用户抱怨说咖啡厅的位置难找,不好停车,座位比较拥挤,空间 小等。 根据所处理文本的粒度,情感分析可以分为篇章 / 句子级情感分析和属性级情 感分析 [4],与属性级情感分析密切相关的还有观点三元组分析。 这种任务学术上被称为 ABSA(Aspect Based Sentiment Analysis,基于属性的情感分析),可以划分为 ACSA(Aspect Category Senti- ment Analysis,基于属性类别的情感分析)和 ATSA(Aspect Term Sentiment Analysis,基于属性项的情感分析)[5],其中 ACSA 是识别在相应预定义属性类别 (Aspect Category)上的情感倾向,如上述评论在属性类别“菜品口味”上表达正向 情感,在属性类别“服务态度”上表达负向情感。ATSA 中是识别针对文本中出现的 相应属性(Aspect Term)的情感倾向,如上述评论中针对属性“饭菜”表达正向情感, 针对属性“服务员”表达负向情感。本文所述属性级情感分析主要指 ACSA 任务。 观点三元组分析包括属性抽取(Aspect Extraction)、观点抽取(Opinion Extraction) 以及属性 - 观点对(Aspect-Opinion)的情感倾向分析三个任务,在学术上称为 Aspect Sentiment Triplet Extraction[6] 或者 Opinion Triplet Extraction[7]。属性抽 取和观点抽取属于信息抽取的范畴,属性 - 观点对的情感倾向分析属于分类任务。 为了建立精准的情感分析能力,在数据标注时我们将情感强度划分为离散的七 档评分——[ 非常负向 , 负向 , 轻微负向 , 中性 , 轻微正向 , 正向 , 强烈正向 ],并采用 Min-Max Normalization 将标注 Label 归一化到 [0 ~ 1]。

2018 年以来以 BERT 为代表的预训练模型在多项 NLP 任务中 取得巨大进展,BERT 在特征抽取上具有较强优势,如浅层的句法特征以及深层的语 义特征。 如图 7(a)所示,美团 App 和大众点评 App 首页信息 流文案大部分抽取自用户真实评论,需要从内容供给上严格控制文本质量,通过句子 级情感分析对供给内容中的负向内容进行过滤,提升终端用户体验。此外,在商业智 能场景中,句子级情感分析还可以帮助商家优化运营策略,如图 7(b)所示,美团商 业大脑通过情感分析能力可以监控用户对商家评价的情感曲线以及评论情感占比等指 标来改善商家运营。
标注人员需要先判断预定义的 属性是否在该评论中被提及,再判断被提及属性上的情感倾向。因此对于每个属性共 有 4 种标签——[ 未提及 , 负向 , 中立 , 正向 ]。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
2018-02-13 剑指offer - 左旋转字符串 - 各种特色情况考虑
2018-02-13 剑指offer - 和为S的两个数字
2018-02-13 第n个丑数——剑指Offer
2018-02-13 剑指Offer - 复杂链表的复制 - 有随机指针
2018-02-13 剑指Offer - 数字在排序数组中出现的次数
2018-02-13 好题目 - 一个数组中有两个数字只出现一次 ,以及很多衍生题目 - 数组统计类的,位操作类的 - 剑指Offer
2018-02-13 这几个视频教程要实验——继续学