摘要: 随机森林在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。学习算法:1. 用N来表示训练例子的个数,M表示变量的数目。2. 我们会被告知一个数m,被用来决定当在一个节点上做决定时,会使用到多少个变量。m应小于M。3. 从N个训练案例中以可重复取样的方式,取样N次,形成一组训练集(即bootstrap取样(待了解))并使用这棵树来对剩余预测其类别,并评估其误差。4. 对于每一个节点,随机选择m个基于此点上的变量。根据这m个变量,计算其最佳的分割方式。5. 每棵树都会完整成长而不会剪枝(Pruning)(未完待续) 阅读全文
posted @ 2012-12-31 00:04 Harrison_ 阅读(519) 评论(0) 推荐(0) 编辑