上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 31 下一页
摘要: ##信息熵以及模拟使用信息熵来进行划分 ###信息熵 前文说到决策树的构建的关键问题就是每个节点在哪个维度做划分?以及某个维度在哪个值上做划分? 那么可以使用计算信息熵来解决这个问题 信息熵是什么,简单来说,在信息论中代表随机变量不确定度的度量,也就是说对于一组数据来说,越不确定越随机,那么信息熵就 阅读全文
posted @ 2021-01-28 20:49 DbWong_0918 阅读(514) 评论(0) 推荐(0) 编辑
摘要: ##决策树 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成树来求出现值的期望大于等于零的概率,是一种用来评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法,由于这种决策分支画成图形很像一棵树的枝干,故称决策树 在机器学习中,决策树是一个预测模型, 阅读全文
posted @ 2021-01-28 20:45 DbWong_0918 阅读(694) 评论(0) 推荐(0) 编辑
摘要: ##使用svm思想解决回归问题 使用svm思想解决是如何解决回归问题,其中回归问题的本质就是找一条线,能够最好的拟合数据点 怎么定义拟合就是回归算法的关键,线性回归算法就是让预测的直线的MSE的值最小,对于SVM来说,拟合的定义是指定一个margin值,在这个margin范围里面,包含的数据点越多越 阅读全文
posted @ 2021-01-27 22:02 DbWong_0918 阅读(511) 评论(0) 推荐(0) 编辑
摘要: ##核函数 SVM算法的本质点击这里 将最优化问题变成 右边的最优化问题中的最大化式子中的后半部分,套了两层求和,一个是i,一个是j,可以说,转变的式子中对于样本数据集的任意的两个向量都要进行向量间的点乘 那么如果想要使用多项式特征的话,原先的多项式变化是先将原来的xi和xj添加上多项式特征,然后在 阅读全文
posted @ 2021-01-27 22:00 DbWong_0918 阅读(855) 评论(0) 推荐(0) 编辑
摘要: ##sklearn中的SVM以及使用多项式特征以及核函数 ###sklearn中的SVM的使用 SVM的理论部分 需要注意的是,使用SVM算法,和KNN算法一样,都是需要做数据标准化的处理才可以,因为不同尺度的数据在其中的话,会严重影响SVM的最终结果 (在notebook中) 加载好需要的包,使用 阅读全文
posted @ 2021-01-27 21:53 DbWong_0918 阅读(2121) 评论(0) 推荐(0) 编辑
摘要: ##SVM支持向量机 ###支持向量机的思想原理 使用支持向量机的思想,既可以解决回归问题,又可以解决分类问题 那么支持向量机的思想是什么? 已经知道逻辑回归这种算法的本质就是在一个平面中寻找决策边界,而分类算法则是认为在这个边界的一侧属于一类,另一侧属于另一类,但是是要边界唯一 对于边界不唯一的问 阅读全文
posted @ 2021-01-27 21:47 DbWong_0918 阅读(468) 评论(0) 推荐(0) 编辑
摘要: ##关于多分类问题中的混淆矩阵,精准率 具体操作 (在notebook中) 使用手写识别数据集,使用全部的样本数据,不做限制,对数据进行分割,使用逻辑回归算法,求解出准确度 import numpy as np import matplotlib.pyplot as plt from sklearn 阅读全文
posted @ 2021-01-25 15:09 DbWong_0918 阅读(1357) 评论(0) 推荐(0) 编辑
摘要: ##ROC曲线 前文讲了PR曲线 这里说ROC曲线,其描述的是TPR和FPR之间的关系 TPR是什么呢,TPR就是召回率 FPR是什么呢,FPR就是和TPR对应的,即真实值为0的一行中的预测为1的部分比例 和精准率和召回率一样,TPR和FPR之间也有着内在的联系,TPR越高,FPR越高,反之一样,R 阅读全文
posted @ 2021-01-25 15:06 DbWong_0918 阅读(191) 评论(0) 推荐(0) 编辑
摘要: ##精准率和召回率的平衡以及精准率召回率曲线 ###精准率和召回率的平衡 前文书道,使用F1 score可以同时考虑到精准率和召回率,那么,怎么能同时让二者都变大呢,可惜,是不行的,因为这两个指标是互相矛盾的,一方提高,一方就会下降,因此要找到两者的平衡 可以通过逻辑回归和决策边界来理解 对于决策边 阅读全文
posted @ 2021-01-25 15:01 DbWong_0918 阅读(866) 评论(0) 推荐(0) 编辑
摘要: ##F1 score 关于精准率和召回率 精准率和召回率可以很好的评价对于数据极度偏斜的二分类问题的算法,有个问题,毕竟是两个指标,有的时候这两个指标也会产生差异,对于不同的算法,精准率可能高一些,召回率可能低一些,反之一样,真正使用的时候应该根据具体的使用场景来去解读这两个指标 想要得到这两个指标 阅读全文
posted @ 2021-01-25 14:52 DbWong_0918 阅读(958) 评论(0) 推荐(1) 编辑
上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 31 下一页