接手他人给的语料时

1.先dos2unix,然后去重;

自己制作语料时

1.注意不要在词条后面加空格。检测办法:按左右箭头键检测行上是否加入了不该加入的空格;

2. 文件的最后一行内容上要按回车键,不然到linux下vim会有neol标识,dos2unix也无效。这种文件状态可能会导致算法运行结果不正确。

 

posted on 2012-06-12 12:17  finallyly  阅读(252)  评论(0编辑  收藏  举报