2018年10月28日

004-基于统计的翻译系统

摘要: 双语数据预处理 学习目标:了解和学习开发汉英双语数据预处理模块。 双语数据预处理是统计机器翻译系统构建的第一步,为词对齐处理提供分词后的双语数据。预处理的工作本质上就是双语数据的分词处理,与传统分词不同的一点在于需要对一些特定类型词汇进行泛化处理,如数字词汇“123.45”泛化为“$number”来 阅读全文

posted @ 2018-10-28 22:26 医疗兵皮特儿 阅读(582) 评论(0) 推荐(0) 编辑

导航