阿飞飞飞

学而时习之

导航

2020年11月7日 #

机器学习——随机森林和极限森林

摘要: 随机森林 在机器学习中,随机森林是一个包含多个决策树的分类器,其中每个决策树之间互不关联,其输出的类别是由个别树输出的类别的众数而定。 算法步骤: 对于N个训练样例,有M个特征,对于每一个决策树来说,都选取m个特征数目,其远远小于M,用来确定每一个决策树上一个节点的决策结果,从训练样例上有放回抽样, 阅读全文

posted @ 2020-11-07 20:15 阿飞飞飞 阅读(756) 评论(0) 推荐(0) 编辑

机器学习——决策树

摘要: 决策树是一种用于分类和回归的有监督学习方法——预测模型 该方法是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值大于0的概率,树中的每一个节点表示某个对象,而每一个分叉路代表某个可能的属性值,而每一个叶节点则对应的是从根节点到该叶节点所经历的路径所表示的对象的值。 例如:决策树解决相亲问题 阅读全文

posted @ 2020-11-07 19:35 阿飞飞飞 阅读(113) 评论(0) 推荐(0) 编辑

机器学习——KNN算法

摘要: 近邻算法(KNN)属于有监督学习的聚类算法,他可以通过测量不同特征值之间的距离进行分类,一个样本在特征空间中的k个最相似的样本大多数属于某一个类别,则该样本也属于这个类别,算法中所选择的邻居都是正确分类的对象。KNN算法测距离依旧使用的是欧式距离。 算法描述: 计算测试数据与各个训练数据之间的距离; 阅读全文

posted @ 2020-11-07 18:54 阿飞飞飞 阅读(174) 评论(0) 推荐(0) 编辑