随笔档案「2019年9月5日」：机器翻译（machine translation）相关 ... - wwwwb

2019年9月5日

摘要： 1.BLEU 主要任务是为了将候选的n-gram和target的n-gram相比较，匹配相似度（与位置无关）基本做法：比较翻译结果中和参考的n-gram个数，直接相除，问题是长句子会得分更高，限制句子长度加入惩罚参数，同时对不同的目标任务对n-gram赋予不同的权重 2.attention 的细节阅读全文

posted @ 2019-09-05 11:26 wwwwb 阅读(464) 评论(0) 推荐(0)

一些需要注意的细节

摘要： 1.离散采样不可导问题，使用gumbel采样方式将不可导部分拉出计算图细节做法https://www.cnblogs.com/initial-h/p/9468974.html 2.关于NLLloss和cross entropy loss 的关系和区别 cross中是计算概率模型输出的概率p和真实的阅读全文

posted @ 2019-09-05 10:56 wwwwb 阅读(118) 评论(0) 推荐(0)

MT框架中avg_checkpoint的做法

摘要： 1.在opennmt框架代码中ensemble的做法是在opennmt/utils/checkpoint.py 对模型中全部参数进行平均，平均后创建新的checkpoint 2.在nmt中https://github.com/tensorflow/nmt tensorflow的一个框架（工程师个人框阅读全文

posted @ 2019-09-05 09:34 wwwwb 阅读(751) 评论(0) 推荐(0)

王博wb

公告