Fighting Offensive Language on Social Media with Unsupervised Text Style Transfer 阅读
这篇论文发在 2018 年的 ACL 上
Motivation
在社交媒体上,常会出现一些攻击性的语言,这给我们的社交环境带来了很不良的影响,作者基于此提出一种将攻击性的语言转换成非攻击性语言的模型
Method
由于不存在平行语料,采用的是无监督学习,作者提出了一种结合 collaborative classifier 、注意力机制和 cycle consistency loss 的编码器-解码器的新方法。
整个模型结构设计的还是蛮简单的,如下图(为了能够更清楚的表达,作者用来多个编码器-解码器、分类器来说明,在实际实验时,都只有一个):
s_i 表示 label ,i ∈ {0,1}, k 表示第几个句子
模型框架主要是 编码器-解码器(RNN),然后中间加入了 注意力机制,分类器使用的是 CNN
损失函数(交叉熵)
-
Forward Transfer
-
重构损失(i --> i)
-
分类损失(i -- > i): 有监督学习(可作为对比)
-
分类损失(i -- > j)
-
-
Backward Transfer(相当于回翻:i -- > j -- > i)
也就是希望能将转换后的句子再转换回啦
-
重构损失(i --> j -- > i)
-
分类损失(回翻后)
-
实验
数据集:Twitter 和 Reddit
对比实验(baseline):Shen et al. Style transfer from non-parallel text by cross-alignment.
Now is better than never
分类:
文本风格迁移文献阅读
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 因为Apifox不支持离线,我果断选择了Apipost!
· 通过 API 将Deepseek响应流式内容输出到前端