2017年1月3日

郑捷《机器学习算法原理与编程实践》学习笔记(第三章 决策树的发展)(二)_C4.5

摘要: (上接第三章) 3.3.1 信息增益率 信息增益率的定义如下: GainRatio(S,A) = Gain(S,A)/SplitInfo(S,A) 其中Gain(S,A)就是ID3算法中的信息增益,而划分信息SplitInfo(S,A)代表了按照特征A划分样本集S的广度和均匀性。 其中Si到Sc是特 阅读全文

posted @ 2017-01-03 16:41 金秀 阅读(371) 评论(0) 推荐(0) 编辑

郑捷《机器学习算法原理与编程实践》学习笔记(第三章 决策树的发展)(一 )_ID3

摘要: 3.1 决策树的基本思想 3.1.1 从一个实例开始(略) 3.1.2 决策树的算法框架(略) 3.1.3 信息熵测度(略) 3.2 ID3决策树 3.2.1 ID3算法(略) 3.2.2 ID3的实现(Python实现) 定义一个ID3DTree的类来封装算法: (1) 数据导入函数 (2)执行决 阅读全文

posted @ 2017-01-03 15:33 金秀 阅读(823) 评论(0) 推荐(0) 编辑

Python_sklearn机器学习库学习笔记(三)logistic regression(逻辑回归)

摘要: # 逻辑回归 ## 逻辑回归处理二元分类 ## 垃圾邮件分类 输出结果: 预测类型:ham.信息:Waiting in e car 4 my mum lor. U leh? Reach home already?预测类型:ham.信息:Dear got train and seat mine low 阅读全文

posted @ 2017-01-03 10:28 金秀 阅读(76805) 评论(3) 推荐(3) 编辑

导航