会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
五色光
复杂系统|复杂网络,cv/nlp,LLM,
博客园
首页
新随笔
联系
订阅
管理
2014年11月4日
统计机器翻译(SMT)步骤总结
摘要: 本文是在Niutrans论坛中的系列教程中总结出来的。1、语料预处理预处理的结果是生成双语分词之后的文件,该步需要注意的是对规则短语,比如数字、日期、网址等,进行泛化处理。可以用正则方法或者其它方法。注意日期中的点和外文人名中的点和网址中的点和句末标点要区分开来,数字和日期也要区分开来。其中变化比较...
阅读全文
posted @ 2014-11-04 10:15 五色光
阅读(5521)
评论(0)
推荐(0)
编辑
公告