随笔分类 -  数据挖掘

数据挖掘学习笔记--AdaBoost算法(一)
摘要:声明: 这篇笔记是自己对AdaBoost原理的一些理解,如果有错,还望指正,俯谢~ 背景: AdaBoost算法,这个算法思路简单. 正文: AdaBoost算法,是一种组合算法(通过多个弱分类器,组合成一个强分类器): 关于AdaBoost算法的流程,简单的描述,我们以A Short Introd 阅读全文

posted @ 2017-01-24 19:04 龚细军 阅读(1306) 评论(0) 推荐(0) 编辑

数据挖掘之聚类算法K-Means总结
摘要:序 由于项目需要,需要对数据进行处理,故而又要滚回来看看paper,做点小功课,这篇文章只是简单的总结一下基础的Kmeans算法思想以及实现; 正文: 1.基础Kmeans算法. Kmeans算法的属于基础的聚类算法,它的核心思想是: 从初始的数据点集合,不断纳入新的点,然后再从新计算集合的“中心” 阅读全文

posted @ 2017-01-22 11:46 龚细军 阅读(3980) 评论(0) 推荐(1) 编辑

数据挖掘之聚类算法Apriori总结
摘要:项目中有时候需要用到对数据进行关联分析,比如分析一个小商店中顾客购买习惯. 1 package com.data.algorithm; 2 3 import com.google.common.base.Splitter; 4 import com.google.common.collect.Lis 阅读全文

posted @ 2017-01-20 20:34 龚细军 阅读(1194) 评论(0) 推荐(0) 编辑

机器学习之KNN算法思想及其实现
摘要:从一个例子来直观感受KNN思想 如下图 , 绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方形比例为3/5,因此绿色圆被赋予蓝色四方形类。 从这个例子中,我们再来看KNN思想: 实现代码: KN 阅读全文

posted @ 2016-09-06 14:56 龚细军 阅读(1071) 评论(0) 推荐(1) 编辑

机器学习之决策树熵&信息增量求解算法实现
摘要:此文不对理论做相关阐述,仅涉及代码实现: 1.熵计算公式: P为正例,Q为反例 Entropy(S) = -PLog2(P) - QLog2(Q); 2.信息增量计算: Gain(S,Sv) = Entropy(S) - (|Sv|/|S|)ΣEntropy(Sv); 举例: 转化数据输入: 1 p 阅读全文

posted @ 2016-09-02 20:44 龚细军 阅读(1777) 评论(0) 推荐(0) 编辑

朴素贝叶斯分类器(离散型)算法实现(一)
摘要:1. 贝叶斯定理: (1) P(A^B) = P(A|B)P(B) = P(B|A)P(A) 由(1)得 P(A|B) = P(B|A)*P(A)/[p(B)] 贝叶斯在最基本题型: 假定一个场景,在一所高中男女比例为4:6, 留长头发的有男学生有女学生, 我们设定女生都留长发 , 而男生中有10% 阅读全文

posted @ 2016-09-01 17:16 龚细军 阅读(3089) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示