摘要: 分词(Tokenization) - NLP学习(1) N-grams模型、停顿词(stopwords)和标准化处理 - NLP学习(2) 之前我们都了解了如何对文本进行处理:(1)如用NLTK文本处理库将文本的句子成分分成了N-Gram模型,与此同时引入了正则表达式去除一些多余的句子成分;(2)将 阅读全文
posted @ 2019-02-11 15:57 JieLongZ 阅读(2924) 评论(1) 推荐(1) 编辑