摘要: 在《Python自然语言处理》一书中的P121出现来一段利用NLTK自带的正则表达式分词器——nlt.regexp_tokenize,书中代码为: 1 text = 'That U.S.A. poster-print ex-costs-ed $12.40 ... 8% ? _' 2 pattern 阅读全文
posted @ 2019-05-16 15:45 不同的日子丶看不同的云 阅读(2079) 评论(0) 推荐(0) 编辑