上一页 1 2 3 4 5 6 7 8 9 10 ··· 14 下一页
摘要: 1. 准备工作 1.1. 安装并初始化airflow,参考以下文档: https://www.cnblogs.com/zackstang/p/11082322.html 其中还要额外安装的是: sudo pip-3.6 install -i https://pypi.tuna.tsinghua.ed 阅读全文
posted @ 2020-03-12 21:34 ZacksTang 阅读(941) 评论(0) 推荐(0) 编辑
摘要: Bagging 与Pasting 我们之前提到过,其中一个获取一组不同分类器的方法是使用完全不同的训练算法。另一个方法是为每个预测器使用同样的训练算法,但是在训练集的不同的随机子集上进行训练。在数据抽样时,如果是从数据中重复抽样(有放回),这种方法就叫bagging(bootstrap aggreg 阅读全文
posted @ 2020-03-08 20:51 ZacksTang 阅读(1391) 评论(0) 推荐(0) 编辑
摘要: 集成学习与随机森林 假设我们现在提出了一个复杂的问题,并抛给几千个随机的人,然后汇总他们的回答。在很多情况下,我们可以看到这种汇总后的答案会比一个专家的答案要更好。这个称为“群众的智慧”。同理,如果我们汇总一组的预测器(例如分类器与回归器)的预测结果,我们可以经常获取到比最优的单个预测器要更好的预测 阅读全文
posted @ 2020-03-04 19:10 ZacksTang 阅读(5152) 评论(0) 推荐(0) 编辑
摘要: 回归 决策树也可以用于执行回归任务。我们首先用sk-learn的DecisionTreeRegressor类构造一颗回归决策树,并在一个带噪声的二次方数据集上进行训练,指定max_depth=2: import numpy as np # Quadratic training set + noise 阅读全文
posted @ 2020-03-02 12:09 ZacksTang 阅读(3798) 评论(0) 推荐(0) 编辑
摘要: 决策树 与SVM类似,决策树在机器学习算法中是一个功能非常全面的算法,它可以执行分类与回归任务,甚至是多输出任务。决策树的算法非常强大,即使是一些复杂的问题,也可以良好地拟合复杂数据集。决策树同时也是随机森林的基础组件,随机森林在当前是最强大的机器学习算法之一。 在这章我们会先讨论如何使用决策树训练 阅读全文
posted @ 2020-02-27 17:08 ZacksTang 阅读(6537) 评论(0) 推荐(0) 编辑
摘要: SVM回归 我们之前提到过,SVM算法功能非常强大:不仅支持线性与非线性的分类,也支持线性与非线性回归。它的主要思想是逆转目标:在分类问题中,是要在两个类别中拟合最大可能的街道(间隔),同时限制间隔侵犯(margin violations);而在SVM回归中,它会尝试尽可能地拟合更多的数据实例到街道 阅读全文
posted @ 2020-02-25 20:30 ZacksTang 阅读(12393) 评论(0) 推荐(0) 编辑
摘要: 非线性SVM分类 尽管SVM分类器非常高效,并且在很多场景下都非常实用。但是很多数据集并不是可以线性可分的。一个处理非线性数据集的方法是增加更多的特征,例如多项式特征。在某些情况下,这样可以让数据集变成线性可分。下面我们看看下图左边那个图: 它展示了一个简单的数据集,只有一个特征x1,这个数据集一看 阅读全文
posted @ 2020-02-21 21:01 ZacksTang 阅读(5991) 评论(0) 推荐(0) 编辑
摘要: SVM-支持向量机 SVM(Support Vector Machine)-支持向量机,是一个功能非常强大的机器学习模型,可以处理线性与非线性的分类、回归,甚至是异常检测。它也是机器学习中非常热门的算法之一,特别适用于复杂的分类问题,并且数据集为小型、或中型的数据集。 这章我们会解释SVM里的核心概 阅读全文
posted @ 2020-02-21 18:50 ZacksTang 阅读(1577) 评论(0) 推荐(0) 编辑
摘要: 多标签分类 到现在为止,我们看到的模型与数据都是将一条数据分类为一个类别。在某些情况下,我们可能需要分类器为每条数据输出多个类别。例如,假设有一个人脸识别分类器,如果它在同一张图片上认出了多张人脸的话,它应该输出什么呢?显然,它应该为每个它认出的人脸打上一个标志。 假设这个人脸识别分类器已经被训练了 阅读全文
posted @ 2020-02-21 10:42 ZacksTang 阅读(2408) 评论(0) 推荐(0) 编辑
摘要: 误差分析 如果上一章中的分类器是一个真实的项目,则我们最好是要遵循机器学习项目步骤:探索数据、准备数据、尝试多个模型、列出表现最好的几个模型、使用GridSearchCV对超参数进行调优、尽可能实现自动化。现在,假设我们已经有了一个性能还不错的模型,接下来我们要找一些办法去优化、提升它。其中一个办法 阅读全文
posted @ 2020-02-19 17:18 ZacksTang 阅读(1285) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 14 下一页