摘要: 集成学习 目录集成学习思维图方法种类集成方法原理误差和方差原理可选取的基分类器集成学习例子Boosting算法代表GBDT:梯度提升决策树Adaboost:基于错误率的提升方法Bagging算法代表随机森林缺点XGBoost库参考 思维图 什么是集成学习?集成学习:通过某种策略来组合多个弱学习器来学 阅读全文
posted @ 2021-06-03 17:50 小肚腩的世界 阅读(103) 评论(0) 推荐(0) 编辑
摘要: 爬虫方案设计(三) 仅供个人交流学习使用,禁止转载,严禁商用!!!任何商业用途与本人无关! 本篇的任务是爬取上篇获得的视频底下的评论。 爬取目标: 主要是针对不同的错误进行处理,把不能处理的错误存储在日志中,尽量保证程序发生错误保证不会意外停止,同时爬取速度不会过快,还不会发生遗漏。 一般出现的错误 阅读全文
posted @ 2021-06-03 17:40 小肚腩的世界 阅读(56) 评论(0) 推荐(0) 编辑
摘要: 爬虫方案设计(二) 仅供个人交流学习使用,禁止转载,严禁商用!!!任何商业用途与本人无关! 根据上一篇博客的分析,围绕着三要素来设计程序。 本篇的任务是爬取创作者上传的视频信息。 爬取策略: 第一种:遍历创作者id的合理范围(目前只实现了); 第二种:广度遍历有人气的创作者或者每个视频主题的代表创作 阅读全文
posted @ 2021-06-03 04:46 小肚腩的世界 阅读(80) 评论(0) 推荐(0) 编辑