随笔分类 - 数据分析&挖掘
谈到数据分析和挖掘相关的技术
摘要:工欲善其事必先利其器,学习数据挖掘,没有好的工具,估计举步维艰。下面是在网上上调研的一些数据挖掘工具,详细情况,参考链接中的内容: http://voyagememoirs.com/pharmine/2008/05/18/summary/ http://wenku.baidu.com/view/5cea1f906bec0975f465e2ab http://wenku.baid...
阅读全文
摘要:目的最近项目中有个需求是文本聚类,实现这个功能需要一些数据挖掘的技术,由于此领域“水很深”,项目也很紧,没有那么多闲功夫去深入研究此领域。向一个相关领域的博士在读同学请教了此问题,推荐阅读《Programming Collective Intelligence》中的相关章节,读后果然豁然开朗,这里再次感谢此同学 。将第三章的大概内容和心得体会记录于此,方便日后查阅。同时,也希望作为契机,为以后进一步深入学习数据挖掘做准备。概要本章主要介绍了聚类算法:Hierachical Clustering:根据两个向量之间的关系得到相关树结构,结果是一个二叉树 ,时间复杂度是O(n^3)K-Means C
阅读全文