lvdongjie-avatarx

2021年1月16日

摘要： Ensemble learning 中文名叫做集成学习，它并不是一个单独的机器学习算法，而是将很多的机器学习算法结合在一起，我们把组成集成学习的算法叫做“个体学习器”。在集成学习器当中，个体学习器都相同，那么这些个体学习器可以叫做“基学习器”。个体学习器组合在一起形成的集成学习，常常能够使得泛化性阅读全文

posted @ 2021-01-16 17:17 lvdongjie-avatarx 阅读(5322) 评论(0) 推荐(0) 编辑

2021年1月15日

集成学习-Boosting之GBDT：梯度提升决策树

摘要：综述 GBDT(Gradient Boosting Decision Tree) 又叫 MART（Multiple Additive Regression Tree)，是一种迭代的决策树算法，该算法由多棵决策树组成，所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力较强的算阅读全文

posted @ 2021-01-15 08:06 lvdongjie-avatarx 阅读(210) 评论(0) 推荐(0) 编辑

2021年1月14日

集成学习-BaggingClassifier，BaggingRegressor

摘要： https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.BaggingClassifier.html?highlight=bagging#sklearn.ensemble.BaggingClassifier https:/ 阅读全文

posted @ 2021-01-14 08:18 lvdongjie-avatarx 阅读(362) 评论(0) 推荐(0) 编辑

集成学习-AdaBoostClassifier，AdaBoostRegressor

摘要： https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.html?highlight=adaboost#sklearn.ensemble.AdaBoostClassifier http 阅读全文

posted @ 2021-01-14 08:17 lvdongjie-avatarx 阅读(437) 评论(0) 推荐(0) 编辑

机器学习-集成学习-boosting之AdaBoost算法详解

摘要： 1. 概述 1.1 集成学习目前存在各种各样的机器学习算法，例如SVM、决策树、感知机等等。但是实际应用中，或者说在打比赛时，成绩较好的队伍几乎都用了集成学习(ensemble learning)的方法。集成学习的思想，简单来讲，就是“三个臭皮匠顶个诸葛亮”。集成学习通过结合多个学习器(例如同种算阅读全文

posted @ 2021-01-14 08:14 lvdongjie-avatarx 阅读(333) 评论(0) 推荐(0) 编辑

2021年1月13日

机器学习-集成算法-Boosting

摘要：概述 Boosting基本思想: 通过改变训练数据的概率分布（训练数据的权值分布），学习多个弱分类器，并将它们线性组合，构成强分类器。 Boosting算法要求基学习器能对特定的数据分布进行学习，这可通过“重赋权法”（re-weighting）实施。对无法接受带权样本的基学习算法，则可通过“重采样法阅读全文

posted @ 2021-01-13 21:25 lvdongjie-avatarx 阅读(303) 评论(0) 推荐(0) 编辑

sklearn 缺失值处理器： Imputer

摘要： class sklearn.preprocessing.Imputer(missing_values=’NaN’, strategy=’mean’, axis=0, verbose=0, copy=True) 参数： missing_values: integer or “NaN”, optiona 阅读全文

posted @ 2021-01-13 19:34 lvdongjie-avatarx 阅读(1232) 评论(0) 推荐(1) 编辑

随机森林扩展- Extra Tree、TRTE、IForest

摘要：特征重要度作为单个的决策树模型，在模型建立时实际上是寻找到某个特征合适的分割点。这个信息可以作为衡量所有特征重要性的一个指标。基本思路如下：如果一个特征被选为分割点的次数越多，那么这个特征的重要性就越强。这个理念可以被推广到集成算法中，只要将每棵树的特征重要性进行简单的平均即可。分别根据特征1 阅读全文

posted @ 2021-01-13 19:11 lvdongjie-avatarx 阅读(1304) 评论(0) 推荐(0) 编辑

机器学习-随机森林算法及其实现（Random Forest）

摘要： https://blog.csdn.net/yangyin007/article/details/82385967 1 什么是随机森林？作为新兴起的、高度灵活的一种机器学习算法，随机森林（Random Forest，简称RF）拥有广泛的应用前景，从市场营销到医疗保健保险，既可以用来做市场营销模拟的阅读全文

posted @ 2021-01-13 08:43 lvdongjie-avatarx 阅读(2558) 评论(0) 推荐(0) 编辑

sklearn API 参考

摘要： https://scikit-learn.org/stable/modules/classes.html 阅读全文

posted @ 2021-01-13 08:04 lvdongjie-avatarx 阅读(56) 评论(0) 推荐(0) 编辑

此博客专攻人工智能。

公告