摘要: CART决策树又称分类回归树,当数据集的因变量为连续性数值时,该树算法就是一个回归树,可以用叶节点观察的均值作为预测值;当数据集的因变量为离散型数值时,该树算法就是一个分类树,可以很好的解决分类问题。但需要注意的是,该算法是一个二叉树,即每一个非叶节点只能引伸出两个分... 阅读全文
posted @ 2018-05-09 14:43 曾先森在努力 阅读(2248) 评论(0) 推荐(0) 编辑
摘要: SVM分类,就是找到一个平面,让两个分类集合的支持向量或者所有的数据(LSSVM)离分类平面最远;SVR回归,就是找到一个回归平面,让一个集合的所有数据到该平面的距离最近。SVR是支持向量回归(support vector regression)的英文缩写,是支持向量... 阅读全文
posted @ 2018-05-09 12:29 曾先森在努力 阅读(14761) 评论(0) 推荐(1) 编辑
摘要: 首先我们需要明确一个概念,我们讨论的线性或者非线性针对的是自变量的系数,而非自变量本身,所以这样的话不管自变量如何变化,自变量的系数如果符合线性我们就说这是线性的。所以这里我们也就可以描述一下多项式线性回归。由此公式我们可以看出... 阅读全文
posted @ 2018-05-09 11:27 曾先森在努力 阅读(491) 评论(0) 推荐(0) 编辑
摘要: 线性回归是最贴近生活的数据模型之一简单的线性回归简单的线性回归公式如下:从公式中我们可以看出,简单线性回归只有一个自变量x1,b1是自变量的系数,y是因变量。x1可能是连续型或者离散型的数据,所以我们需要通过x1找出最合适的系数b1从而得到关于因变量y的曲线。我们下面... 阅读全文
posted @ 2018-05-09 10:58 曾先森在努力 阅读(587) 评论(0) 推荐(0) 编辑