摘要: 从大一开始接触TF-IDF,一直觉得这个特别简单,,但是图样图森破,,, 即使现在来说,也似乎并非完全搞懂 核心思想: 计算词语在该文章中权重,与词语出现次数和词语价值有关 词语出现次数,重复即强调,越重要 词语价值,出现在越多的文档中越滥情,越廉价 公式: 词频TF = 出现次数 / 总次数 逆向 阅读全文
posted @ 2017-08-07 14:52 水奈樾 阅读(1136) 评论(0) 推荐(0) 编辑
摘要: sklearn是scikit-learn的简称,诸多python工具包都需要这个库 安装顺序: wheel numpy scipy sklearn 因为这个库一直安装不好,都没有动力继续深造机器学习了,,,,kuku 报错原因: Windows系统的pip install可能对于scipy等库的安装 阅读全文
posted @ 2017-08-07 10:03 水奈樾 阅读(35256) 评论(1) 推荐(0) 编辑