Parallel Data Augmentation for Formality Style Transfer 阅读

发表在 ACL 2020

属于文本迁移中的半监督方法

动机

现有的平行语料很少，而神经网络含有大量参数需要训练学习，这时需要更多的平行语料提供更多有用的信息，因此，作者针对 formal 风格迁移任务提出了三种数据增强方法，来获得更多有用的句子对

方法

Back Translation

机器翻译中很常见的一种方数据增强方法，将目标语言使用训练好的翻译模型翻译成原语言，构成伪句子对

先用已有的平行语料（informal--formal）训练一个 seq2seq 模型，然后将目标语句中 formal 的语句喂给这个 seq2seq 模型，生成 informal 句子，形成伪句子对 informal—formal，来扩充平行语料
Formality discrimination

先将 informal 英语句子翻译成另一种语言（如法语），然后将翻译回英语

使用带 formal 标签的语料训练一个 CNN 来给句子打分，如果大于阈值，则被选为伪平行语料
multi-task transfer

使用其它任务中带注释的句子对，观察到 inform l的句子通常语法是错误的，而 formal 的句子语法是对的，因此可以将 GEC（Grammatical error correction）模型所用到的训练数据集直接扩充到现有的平行语料

模型

使用 transformer（base）作为 seq2seq 模型

训练方法：使用增强的数据进行预训练，再用现有的平行语料进行微调

实验

文章在实验方面做的还是比较充分的，对影响结果的因素都做了定性分析，但感觉缺少对选择 transformer 模型的对比分析

posted @ 2020-09-17 19:15 -费费阅读(459) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· AI与.NET技术实操系列：基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语，封装的思维：从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热？

阅读排行：
· 25岁的心里话
· 闲置电脑爆改个人服务器（超详细） #公网映射 #Vmware虚拟网络编辑器
· 零经验选手，Compose 一天开发一款小游戏！
· 因为Apifox不支持离线，我果断选择了Apipost！
· 通过 API 将Deepseek响应流式内容输出到前端

公告

每日一言（ヒトコト）

人生得意须尽欢，莫使金樽空对月！

昵称： -费费
园龄： 7年4个月
粉丝： 2
关注： 3

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

最新随笔

随笔分类

随笔档案

阅读排行榜