摘要: 一,引言 尽管线性回归包含了一些强大的方法,但这些方法创建的模型需要拟合所有的样本数据。当数据拥有众多特征并且特征之间的关系比较复杂时,构建全局线性模型就会非常困难。并且,在实际生活中很多问题都是非线性的,很难通过全局线性模型来拟合所有数据。 解决上述非线性数据的拟合问题的一个可行的方法是,将数据集 阅读全文
posted @ 2018-11-09 15:29 Python少年 阅读(789) 评论(0) 推荐(0) 编辑
摘要: 转自:https://www.cnblogs.com/zy230530/p/6942458.html 一,引言 前面讲到的基本都是分类问题,分类问题的目标变量是标称型数据,或者离散型数据。而回归的目标变量为连续型,也即是回归对连续型变量做出预测,最直接的办法是依据输入写出一个目标值的计算公式,这样, 阅读全文
posted @ 2018-11-09 10:33 Python少年 阅读(2230) 评论(0) 推荐(0) 编辑
摘要: Adaboost算法概述 Adaboost算法核心思想:“三个臭皮匠赛过一诸葛亮”。我们平常构建的分类模型可以说是弱分类器,若将这些弱分类器组合起来可以成为一个强分类器。大多数的提升方法是该表训练数据的概率分布(训练数据的权值分布),针对不同的训练数据分布调用弱学习算法学习。 如何改变训练数据的权值 阅读全文
posted @ 2018-11-09 08:43 Python少年 阅读(319) 评论(0) 推荐(0) 编辑
摘要: 工业界往往会根据实际的业务场景拟定相应的业务指标。本文旨在一起学习比较经典的三大类评价指标,其中第一、二类主要用于分类场景、第三类主要用于回归预测场景,基本思路是从概念公式,到优缺点,再到具体应用(分类问题,本文以二分类为例)。 1.准确率P、召回率R、F1 值 定义 准确率(Precision): 阅读全文
posted @ 2018-11-09 08:34 Python少年 阅读(1504) 评论(0) 推荐(0) 编辑