机器学习-分类问题 - 随笔分类 - ZacksTang

分类问题（七）多标签分类与多输出分类

摘要：多标签分类到现在为止，我们看到的模型与数据都是将一条数据分类为一个类别。在某些情况下，我们可能需要分类器为每条数据输出多个类别。例如，假设有一个人脸识别分类器，如果它在同一张图片上认出了多张人脸的话，它应该输出什么呢？显然，它应该为每个它认出的人脸打上一个标志。假设这个人脸识别分类器已经被训练了阅读全文

posted @ 2020-02-21 10:42 ZacksTang 阅读(2465) 评论(0) 推荐(0) 编辑

分类问题（六）误差分析

摘要：误差分析如果上一章中的分类器是一个真实的项目，则我们最好是要遵循机器学习项目步骤：探索数据、准备数据、尝试多个模型、列出表现最好的几个模型、使用GridSearchCV对超参数进行调优、尽可能实现自动化。现在，假设我们已经有了一个性能还不错的模型，接下来我们要找一些办法去优化、提升它。其中一个办法阅读全文

posted @ 2020-02-19 17:18 ZacksTang 阅读(1300) 评论(0) 推荐(0) 编辑

分类问题（五）多元分类

摘要：多元分类之前介绍过二元分类器，可以将数据分成两个类别（例如“数字5”和“非数字5”）。多元分类器（也称为多项式分类器）可以区分两个以上的类别。有些算法（例如随机森林或朴素贝叶斯）可以直接处理多个类别。其他如SVM、线性分类器则是严格的二元分类器。不过我们仍有很多不同的办法可以让二元分类器实现多元阅读全文

posted @ 2020-02-19 13:37 ZacksTang 阅读(3417) 评论(0) 推荐(0) 编辑

分类问题（四）ROC曲线

摘要：ROC曲线 ROC曲线是二元分类器中常用的工具，它的全称是 Receiver Operating Characteristic，接收者操作特征曲线。它与precision/recall 曲线特别相似，但是它画出的是true positive rate（recall的另一种叫法）对应false pos 阅读全文

posted @ 2020-02-18 19:07 ZacksTang 阅读(1800) 评论(0) 推荐(0) 编辑

分类问题（三）混淆矩阵，Precision与Recall

摘要：混淆矩阵衡量一个分类器性能的更好的办法是混淆矩阵。它基于的思想是：计算类别A被分类为类别B的次数。例如在查看分类器将图片5分类成图片3时，我们会看混淆矩阵的第5行以及第3列。为了计算一个混淆矩阵，我们首先需要有一组预测值，之后再可以将它们与标注值（label）进行对比。我们也可以在测试集上做预测阅读全文

posted @ 2020-02-18 12:41 ZacksTang 阅读(4060) 评论(0) 推荐(0) 编辑

分类问题（二）分类器的性能衡量

摘要：性能衡量评估一个分类器的性能一般比评估一个回归器（regressor）更为复杂，所以我们会在这里大篇幅介绍分类器的性能评估，并且它也有多种评估方法。使用CV衡量准确度一个比较好的评估模型的办法是使用交叉验证。sk-learn提供了一个交叉验证精准度的方法cross_val_score()，不过阅读全文

posted @ 2020-02-17 20:01 ZacksTang 阅读(917) 评论(0) 推荐(0) 编辑

分类问题（一）MINST数据集与二元分类器

摘要：分类问题在机器学习中，主要有两大类问题，分别是分类和回归。下面我们先主讲分类问题。 MINST 这里我们会用MINST数据集，也就是众所周知的手写数字集，机器学习中的 Hello World。sk-learn 提供了用于直接下载此数据集的方法： from sklearn.datasets impo 阅读全文

posted @ 2020-02-16 13:56 ZacksTang 阅读(1752) 评论(0) 推荐(1) 编辑

ZacksTang

随笔分类 - 机器学习-分类问题

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜