《机器学习进阶》Udacity 监督学习 决策树

这个课程中没有介绍到的:

剪枝如何操作?ID3的算法的缺点是什么?如何改进?还有其他的算法没有?什么是基尼系数?和熵,信息增益有什么关系?Sklearn决策树算法中可以调节的参数有哪些?

吴恩达:机器学习:https://www.bilibili.com/video/av9912938/?p=60

 

 

 

 

 

当变量有多个时(不是只有A和B两个变量了)

 

 

当变成异或时,(奇校验码)复杂度变为2的n次方。

这样XOR问题可以转换为组合问题:

 

 

 

 

 

增长的速率是非常非常非常快的。

 

 

 

 

 

 

 

 

 

限定偏差:

 

 

 

 

优选偏差:

 

 

 

归纳偏差:

 

 

 

 

 

 

第三点是由第一点自然得到的。

 

 

 

 

 想法:

 

 

 

剪枝操作:

 

 如果误差太大的话可以不用剪枝,如果误差比较小可以使用剪枝。

 

 

 

 

 

 

 

 

 比如:

 

 

posted @ 2019-12-30 11:21  JasonPeng1  阅读(181)  评论(0编辑  收藏  举报