NLP 对抗方法整理
NLP中对抗应用
1. 分词 , 可以用GAN来做,消除不同分词器的差异性
2. 风格迁移, 这个在图像中应用较多,在NLP中同样可行
3. 提高问答系统/阅读理解的性能。
4. 机器翻译应该也可以做,可以用GAN,不同的翻译规则 -> 趋于相同的答案
那这么说,一切和消歧相关的其实都可以用GAN来做
QA对抗攻击
目前能想到的:
1. 调换两个字符的位置
2. 调换两个单词的位置
3. 用空白embedding代替关键词embedding
4. 用相似词代替原有关键词
5. 梯度下降学习可以攻击成功的embedding(怎么保证decode出来的语义合理,比如,在词典中有所对应)
以上都是讲在材料/supporting facts上做攻击
同样可以攻击question
1. 比如上述3,4,想办法代替原有词
2. 当然也有一些论文指出,QA system常常会忽略一些重要的描述词。这个也是一个攻击的点。