摘要: 文本特征提取 1.切开文本中的每个词,我们把这个叫分词 2.每一个文本都用一组词对应的数值来表示它,这就变成结构化数据了。每个词对应的数值就是该词在文本中出现的次数。 3.上述的这种对文本的特征表示方法就称为“词袋”模型, 词袋的英文是Bag of Words,所以有时候又把词袋叫 BOW 不是每一 阅读全文
posted @ 2021-05-27 17:48 ICDTAD 阅读(39) 评论(0) 推荐(0) 编辑