上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 31 下一页
摘要: ##决策树的局限性 局限性这方面,很明显的一点就是关于决策边界的划分,决策树的决策边界是非常规整的,都是直线,垂直于横轴或者垂直于纵轴 这就导致了绘制出的决策边界很可能不是真实情况的决策边界,如果决策边界是一条斜线,那么决策树的决策边界一定不对,因为画不出来,乂,多捞嗷 而且可能因为数据的数量不够多 阅读全文
posted @ 2021-01-28 21:04 DbWong_0918 阅读(435) 评论(0) 推荐(0)
摘要: ##决策树解决回归问题 如果输出是一个具体的数,这就是一个回归问题,相应的一个新的样本点到了决策树之后,使用决策树以后到达叶子节点中,就可以用叶子节点中相应的数据输出值的平均值来作为预测的结果 具体实现 (在notebook中) 加载好需要的类库,使用波士顿房价这个数据集,对数据集进行训练数据集和测 阅读全文
posted @ 2021-01-28 21:02 DbWong_0918 阅读(639) 评论(0) 推荐(0)
摘要: ##CART与决策树中的超参数 先前的决策树其实应该称为CART CART的英文是Classification and regression tree,全称为分类与回归树,其是在给定输入随机变量X条件下输出随机变量Y的条件概率分布的学习方法,就是假设决策树是二叉树,内部结点特征的取值为“是”和“否” 阅读全文
posted @ 2021-01-28 20:59 DbWong_0918 阅读(714) 评论(0) 推荐(0)
摘要: ##基尼系数 使用信息熵的方式对决策树进行划分 除了时候信息熵来进行划分,还可以使用另一个指标来进行划分,指标就是基尼系数 基尼系数的式子很简单,取值情况和信息熵一样 假设有两个类别,一个占比x,另一个占比1-x,那么上面的式子就可以变成(抛物线) 可以发现这个是以0.5为对称轴的,即0.5的时候取 阅读全文
posted @ 2021-01-28 20:54 DbWong_0918 阅读(345) 评论(0) 推荐(0)
摘要: ##信息熵以及模拟使用信息熵来进行划分 ###信息熵 前文说到决策树的构建的关键问题就是每个节点在哪个维度做划分?以及某个维度在哪个值上做划分? 那么可以使用计算信息熵来解决这个问题 信息熵是什么,简单来说,在信息论中代表随机变量不确定度的度量,也就是说对于一组数据来说,越不确定越随机,那么信息熵就 阅读全文
posted @ 2021-01-28 20:49 DbWong_0918 阅读(533) 评论(0) 推荐(0)
摘要: ##决策树 决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成树来求出现值的期望大于等于零的概率,是一种用来评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法,由于这种决策分支画成图形很像一棵树的枝干,故称决策树 在机器学习中,决策树是一个预测模型, 阅读全文
posted @ 2021-01-28 20:45 DbWong_0918 阅读(717) 评论(0) 推荐(0)
摘要: ##使用svm思想解决回归问题 使用svm思想解决是如何解决回归问题,其中回归问题的本质就是找一条线,能够最好的拟合数据点 怎么定义拟合就是回归算法的关键,线性回归算法就是让预测的直线的MSE的值最小,对于SVM来说,拟合的定义是指定一个margin值,在这个margin范围里面,包含的数据点越多越 阅读全文
posted @ 2021-01-27 22:02 DbWong_0918 阅读(522) 评论(0) 推荐(0)
摘要: ##核函数 SVM算法的本质点击这里 将最优化问题变成 右边的最优化问题中的最大化式子中的后半部分,套了两层求和,一个是i,一个是j,可以说,转变的式子中对于样本数据集的任意的两个向量都要进行向量间的点乘 那么如果想要使用多项式特征的话,原先的多项式变化是先将原来的xi和xj添加上多项式特征,然后在 阅读全文
posted @ 2021-01-27 22:00 DbWong_0918 阅读(905) 评论(0) 推荐(0)
摘要: ##sklearn中的SVM以及使用多项式特征以及核函数 ###sklearn中的SVM的使用 SVM的理论部分 需要注意的是,使用SVM算法,和KNN算法一样,都是需要做数据标准化的处理才可以,因为不同尺度的数据在其中的话,会严重影响SVM的最终结果 (在notebook中) 加载好需要的包,使用 阅读全文
posted @ 2021-01-27 21:53 DbWong_0918 阅读(2197) 评论(0) 推荐(0)
摘要: ##SVM支持向量机 ###支持向量机的思想原理 使用支持向量机的思想,既可以解决回归问题,又可以解决分类问题 那么支持向量机的思想是什么? 已经知道逻辑回归这种算法的本质就是在一个平面中寻找决策边界,而分类算法则是认为在这个边界的一侧属于一类,另一侧属于另一类,但是是要边界唯一 对于边界不唯一的问 阅读全文
posted @ 2021-01-27 21:47 DbWong_0918 阅读(494) 评论(0) 推荐(0)
上一页 1 ··· 21 22 23 24 25 26 27 28 29 ··· 31 下一页