2018 年 12月 4 日随笔档案 - Yaniesta

机器学习关于集成算法的两种基本思想

摘要：集成算法把训练集分为B个（可重复），即bootstrap数据集，然后分别求出其中的beta值然后进行加权平均。如果每个子集的错误都是独立的，这种方法就可以减小误差。Variance一定减小。在决策树方面，这种方法尤为有效。缺点是解释性降低。代表算法有random forest。每一次的迭代都要阅读全文

posted @ 2018-12-04 11:19 Yaniesta 阅读(894) 评论(0) 推荐(0) 编辑

2018年12月4日

公告