摘要: CountVectorizer: CountVectorizer可以将文本文档集合转换为token计数矩阵。(token可以理解成词) 此实现通过使用scipy.sparse.csr_matrix产生了计数的稀疏表示。 如果不提供一个先验字典,并且不使用进行某种特征选择的分析器,那么特征的数量将与通 阅读全文
posted @ 2018-11-13 17:12 桑胡 阅读(3622) 评论(0) 推荐(0) 编辑