机器学习之特征提取(一)—— CountVectorizer文本特征提取

CountVectorizer是文本特征提取的一种方式:本文为稀疏矩阵具体含义

其中new_data所输出的值用toarray()可以转化为稀疏矩阵

new_data.shape():输出的是稀疏矩阵的维度(列表长度X词典个数)

 

posted @ 2022-10-20 15:04  许个未来—  阅读(478)  评论(0编辑  收藏  举报