2016年2月22日
摘要: 1. 词条化是将给定的字符序列拆分成一系列子序列的过程,其中每个子序列称为一个词条(token)。在这个过程中,可能会同时去掉一些特殊字符,如标点符号等。 输入:Friends, Romans, Countrymen, lend me your ears; 输出:Friends Romans Cou 阅读全文
posted @ 2016-02-22 20:09 summerkiki 阅读(503) 评论(0) 推荐(0) 编辑