2017 年 4月 10 日随笔档案 - 刘建平Pinard

2017年4月10日

摘要：在文本挖掘的分词原理中，我们讲到了文本挖掘的预处理的关键一步：“分词”，而在做了分词后，如果我们是做文本分类聚类，则后面关键的特征预处理步骤有向量化或向量化的特例Hash Trick，本文我们就对向量化和特例Hash Trick预处理方法做一个总结。 1. 词袋模型在讲向量化与Hash Trick 阅读全文

posted @ 2017-04-10 14:56 刘建平Pinard 阅读(27940) 评论(36) 推荐(8) 编辑

刘建平Pinard

十五年码农，对数学统计学，数据挖掘，机器学习，大数据平台，大数据平台应用开发，大数据可视化感兴趣。

公告