摘要:
低资源: 平行语料库:质量不行。 伪数据:用单语语料库单向翻译,构造伪平行语料库 半监督学习 对偶学习:微软的 多任务学习:百度的 谷歌:通用的语言翻译模型 最大期望似然估计 —————————————————————————————————————————————————————————————— 阅读全文
摘要:
受限词汇量:我们不能把全部的所有词汇都汇总起来,这个集合太大了。我们只能选一些。 受计算复杂度的限制,仅能使用有限的词汇量。 这里有几种方法: —————————————————————————————————————————————————————————————— 先验约束是什么呢? 神经网络是 阅读全文
摘要:
神经机器翻译近期的研究进展,主要集中在7个方面 1. 网络架构 神经网络图灵机:考虑加入了Memory机制 序列拷贝:考虑将序列拷贝应用到机器翻译,但是没有取得理想的效果 利用记忆的机制:在decoder时,加入了Memory的机制 更深层的网络,似乎并没有取得什么显著的效果提升。 卷积序列到序列的 阅读全文