摘要: 1、认识决策树: 决策树思想非常朴素,程序设计中的条件就是if-then结构,最早的决策树就是利用这类结构分割数据的一中分类学习方法。 2、信息论基础-银行贷款分析 香农在1948年提出信息论,单位为比特; 信息熵:可以理解为代价;信息和消除不确定性是相联系的; 信息增益:当得知特征x的信息而使得类 阅读全文
posted @ 2018-07-29 21:29 zglbt 阅读(118) 评论(0) 推荐(0) 编辑
摘要: K最近邻(k-Nearest Neighbor,KNN)分类算法 1、定义:如果一个样本在特征空间中的k个最近似(即特征空间中最临近)的样本中大多数属于某一类别,则该样本也属于这个类别。 2、计算公式:; 3、K-近邻算法需要做标准化处理; 4、K-近邻算法API 5、优点: 1)简单、无需参数处理 阅读全文
posted @ 2018-07-29 17:39 zglbt 阅读(89) 评论(0) 推荐(0) 编辑
摘要: 机器学习分类: 监督学习(预测) 1)分类:K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络; 2)回归:线性回归、岭回归; 无监督学习 1)聚类:K-means; 监督学习:特征值+目标值;(有标准答案) 无监督学习:特征值+样本集;(无标准答案) 分类:目标值离散; 回归:目标值连 阅读全文
posted @ 2018-07-29 15:53 zglbt 阅读(347) 评论(0) 推荐(0) 编辑