摘要: 序言 你可能早早就听说过这个故事: 在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家所津津乐道。沃尔玛拥有世界上最大的数据仓库系统,为了能够准确了解顾客在其门店的购买习 阅读全文
posted @ 2018-03-05 19:44 inpluslab-dataplayer 阅读(475) 评论(1) 推荐(0) 编辑
摘要: 本文由中山大学In+ Lab整理完成,转载注明出处 团队介绍 传送门 1序言 要明白什么是SVM,便得从分类说起。本书开头已经提到,分类作为数据挖掘领域中一项非常重要的任务,它的目的是学会一个分类函数或分类模型(或者叫做分类器),而支持向量机本身便是一种监督式学习的方法, 它广泛的应用于统计分类以及 阅读全文
posted @ 2018-03-05 19:20 inpluslab-dataplayer 阅读(344) 评论(0) 推荐(0) 编辑
摘要: 本文由中山大学In+ Lab整理完成,转载注明出处 团队介绍 传送门 序言 KNN全称K-Nearest Neighbor algorithm,又称K近邻算法。由于KNN是“惰性学习”(lazy learning)的著名代表,不做任何模型训练,训练时间开销为零,所以我们称它为“史上最懒惰的算法”。看 阅读全文
posted @ 2018-03-05 17:38 inpluslab-dataplayer 阅读(2242) 评论(0) 推荐(1) 编辑
摘要: 本文由中山大学In+ Lab整理完成,转载注明出处 团队介绍 传送门 神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向--深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法,同时也可以更好地帮助你理解深度学习技术。 1. 神经元 神经元是神经网络的最基本单元。首先,我们先 阅读全文
posted @ 2018-03-05 13:00 inpluslab-dataplayer 阅读(432) 评论(0) 推荐(0) 编辑
摘要: 本文由中山大学In+ Lab整理完成,转载注明出处 团队介绍 "传送门" 1. 序言 Adaboost算法的思想是将多个弱分类器组合成一个强分类器的过程,Adaboost全称Adaptive Boosting意思就是自适应提升算法,也就是自适应地完成弱分类器的学习和组合过程。 2. Adaboost 阅读全文
posted @ 2018-03-05 10:50 inpluslab-dataplayer 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 本文由中山大学In+ Lab整理完成,转载注明出处 团队介绍 传送门 逻辑回归 逻辑回归(logistic regression)是机器学习中的经典分类方法。看到这个机器学习方法的名字,你可能会有点疑惑:“逻辑回归明明是一个分类方法,为什么名字里面有回归的字眼?”,这实际上是个好问题,说明你对分类和 阅读全文
posted @ 2018-03-05 10:33 inpluslab-dataplayer 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 本文由中山大学In+ Lab整理完成,转载注明出处 团队介绍 传送门 GBDT 序言 GBDT (Gradient Boosting Decision Tree)又叫MART (Multiple Additive Regression Tree),是一种迭代的决策树算法,即该算法由多棵决策树组成,所 阅读全文
posted @ 2018-03-05 10:10 inpluslab-dataplayer 阅读(391) 评论(0) 推荐(0) 编辑
摘要: 本文由中山大学In+ Lab整理完成,转载注明出处 团队介绍 传送门 一、什么是数据挖掘 随着alphago在围棋上横扫各路高手,轻松击败李世石使得人工智能大火,各种关于数据挖掘、人工智能、机器学习的文章络绎不绝。由此引发了大家的思考,什么是数据挖掘? 数据挖掘通俗点来讲是通过某种方式找出潜藏在大量 阅读全文
posted @ 2018-03-05 09:59 inpluslab-dataplayer 阅读(482) 评论(0) 推荐(0) 编辑