摘要: 1. 理论基础 1. 理论基础 由于数据挖掘所有数据都要以数字形式存在,而文本是以字符串形式存在。所以进行文本挖掘时需要先对字符串进行数字化,从而能够进行计算。TF-IDF就是这样一种技术,能够将字符串转换为数字,从而能够进行数据计算。 TF-IDF(term frequency–inverse d 阅读全文
posted @ 2017-08-23 21:47 xiuneng 阅读(9506) 评论(0) 推荐(1) 编辑