2017 年 7月 5 日随笔档案 - 大自然的流风

2017年7月5日

摘要：用Python实现随机森林算法，深度学习拥有高方差使得决策树（secision tress）在处理特定训练数据集时其结果显得相对脆弱。bagging（bootstrap aggregating 的缩写）算法从训练数据的样本中建立复合模型，可以有效降低决策树的方差，但树与树之间有高度关联（并不是理想的树的状态）。随机森林算法（Random forest algorithm）是对 bagging 算法的扩展。除了仍然根据从训练数据样本建立复合模型之外，随机森林对用做构建树（tree）的数据特征做了一定限制，使得生成的决策树之间没有关联，从而提升算法效果。本教程将实现如何用 Python 实现随机森林算法。阅读全文

posted @ 2017-07-05 15:02 大自然的流风阅读(26067) 评论(2) 推荐(1) 编辑

大自然的流风

在关键时刻听从自己内心的声音！

公告