摘要: 如上图,我们直到右边两个人的身高体重以及穿衣尺码,想要知道左边人的穿衣尺码,若单纯将身高体重数值相加,得到与预期相悖的结论。这是由于身高范围在[115,175],而体重范围在[5,7],两者范围相差较大,应该先归一化。 缩放公式: sklearn中相关实现: 阅读全文
posted @ 2016-06-01 14:44 python挖掘 阅读(492) 评论(0) 推荐(0) 编辑
摘要: http://www.naftaliharris.com/blog/visualizing-k-means-clustering/ 一片不错的博文:http://coolshell.cn/articles/7779.html K-means算法如下: K-Means主要有两个最重大的缺陷: k是事先 阅读全文
posted @ 2016-06-01 13:30 python挖掘 阅读(238) 评论(0) 推荐(0) 编辑
摘要: 理解机器学习基本算法的设计思想和求解手段,如SVM, LR, RF, Boosting等 SVM支持向量机 寻找最大分割平面 为过拟合,应该增加惩罚项 LR逻辑回归:一种线性分类器 RF随机森林 Boosting 朴素贝叶斯: 决策树: 阅读全文
posted @ 2016-06-01 09:39 python挖掘 阅读(170) 评论(0) 推荐(0) 编辑