摘要: ##关于多分类问题中的混淆矩阵,精准率 具体操作 (在notebook中) 使用手写识别数据集,使用全部的样本数据,不做限制,对数据进行分割,使用逻辑回归算法,求解出准确度 import numpy as np import matplotlib.pyplot as plt from sklearn 阅读全文
posted @ 2021-01-25 15:09 DbWong_0918 阅读(1380) 评论(0) 推荐(0)
摘要: ##ROC曲线 前文讲了PR曲线 这里说ROC曲线,其描述的是TPR和FPR之间的关系 TPR是什么呢,TPR就是召回率 FPR是什么呢,FPR就是和TPR对应的,即真实值为0的一行中的预测为1的部分比例 和精准率和召回率一样,TPR和FPR之间也有着内在的联系,TPR越高,FPR越高,反之一样,R 阅读全文
posted @ 2021-01-25 15:06 DbWong_0918 阅读(204) 评论(0) 推荐(0)
摘要: ##精准率和召回率的平衡以及精准率召回率曲线 ###精准率和召回率的平衡 前文书道,使用F1 score可以同时考虑到精准率和召回率,那么,怎么能同时让二者都变大呢,可惜,是不行的,因为这两个指标是互相矛盾的,一方提高,一方就会下降,因此要找到两者的平衡 可以通过逻辑回归和决策边界来理解 对于决策边 阅读全文
posted @ 2021-01-25 15:01 DbWong_0918 阅读(917) 评论(0) 推荐(0)
摘要: ##F1 score 关于精准率和召回率 精准率和召回率可以很好的评价对于数据极度偏斜的二分类问题的算法,有个问题,毕竟是两个指标,有的时候这两个指标也会产生差异,对于不同的算法,精准率可能高一些,召回率可能低一些,反之一样,真正使用的时候应该根据具体的使用场景来去解读这两个指标 想要得到这两个指标 阅读全文
posted @ 2021-01-25 14:52 DbWong_0918 阅读(1008) 评论(0) 推荐(1)
摘要: ##混淆矩阵,精准率和召回率 评论回归算法的好坏点击这里 评价分类算法是不能单单靠一个分类准确度就可以衡量的,单用一个分类准确度是有问题的 比如说,一个癌症预测系统,输入体检信息,就可以判断是否得了癌症,这个系统的预测准确率有99.9%,但是不能说这个系统就是好的,因为如果患有癌症的概率是0.1%, 阅读全文
posted @ 2021-01-25 14:49 DbWong_0918 阅读(2831) 评论(0) 推荐(0)
摘要: ##OvO与OvR 前文书道,逻辑回归只能解决二分类问题,不过,可以对其进行改进,使其同样可以用于多分类问题,其改造方式可以对多种算法(几乎全部二分类算法)进行改造,其有两种,简写为OvO与OvR OvR one vs rest,即一对剩余所有,如字面意思,有的时候称为OvA,one vs all 阅读全文
posted @ 2021-01-24 15:47 DbWong_0918 阅读(3176) 评论(0) 推荐(0)
摘要: ##在逻辑回归中使用多项式特征以及在sklearn中使用逻辑回归并添加多项式 ###在逻辑回归中使用多项式特征 在上面提到的直线划分中,很明显有个问题,当样本并没有很好地遵循直线划分(非线性分布)的时候,其预测的结果是不太准的,所以可以引用多项式项,从线性回归转换成多项式回归,同理,为逻辑回归添加多 阅读全文
posted @ 2021-01-24 15:41 DbWong_0918 阅读(1319) 评论(0) 推荐(0)
摘要: ##决策边界 逻辑回归的原理详见这里 总的来说,可以总结为一个式子 而决策边界就是 其为两个为两个向量的点乘,同时也可以代表一条直线,如果X有两个特征 转换成可以具体实现的式子以后可以得到 具体的实现 (在notebook中) 使用自己编写的回归算法,且依旧使用鸢尾花数据集 import numpy 阅读全文
posted @ 2021-01-24 15:33 DbWong_0918 阅读(792) 评论(0) 推荐(0)
摘要: ##实现逻辑回归算法 实现代码 在python chame中创建LogisticRegression.py文件,写入想要实现的功能 其中,可以将原先的LinearRegression复制过来,详情可见以前的关于线性回归的博客,修改类名,不用的功能直接删除,添加上sigmoid函数以及计算结果概率向量 阅读全文
posted @ 2021-01-24 15:26 DbWong_0918 阅读(134) 评论(0) 推荐(0)
摘要: ##逻辑回归算法 逻辑回归算法的概念不咋叙述 逻辑回归算法看上去是解决回归问题的算法,但是其实是解决的分类问题,那么回归算法是如何解决分类问题呢?逻辑回归的原理是将样本的特征和样本发生的概率联系起来,即预测这个样本的发生概率是多少,而这个概率是一个数,因此可称这个为回归问题 对于机器算法来说,其本质 阅读全文
posted @ 2021-01-24 15:20 DbWong_0918 阅读(1338) 评论(0) 推荐(0)