上一页 1 2 3 4 5 6 7 8 ··· 10 下一页
摘要: 过拟合 过拟合相当于一个人只会读书,却不知如何利用知识进行变通。 相当于他把考试题目背得滚瓜烂熟,但一旦环境稍微有些变化,就死得很惨。 从图形上看,类似下图的最右图: 从数学公式上来看,这个曲线应该是阶数太高的函数,因为一般任意的曲线都能由高阶函数来拟合,它拟合得太好了,因此丧失了泛化的能力。 用L 阅读全文
posted @ 2017-12-25 11:01 dreampursuer 阅读(1262) 评论(0) 推荐(0) 编辑
摘要: 交叉验证(Cross validation),有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证是一种评估统计分析、机器学习算法对独 阅读全文
posted @ 2017-12-22 11:32 dreampursuer 阅读(496) 评论(0) 推荐(0) 编辑
摘要: 在前面的一篇博文中关于计算房价中我们也大致提到了标准化的概念,也就是比如对于影响房价的参数中有面积和户型,面积的取值范围可以很广,它可以从0 500平米,而户型一般也就1 5。 标准化就是要把这两种参数的取值范围处于一个相对接近的地位,这样在进行梯度下降的计算中能够比较稳定地朝下落方向走,而不至于某 阅读全文
posted @ 2017-12-20 10:52 dreampursuer 阅读(664) 评论(0) 推荐(0) 编辑
摘要: 本节主要讲述模型中的各种属性及其含义。 例如上个博文中,我们有用线性回归模型来拟合房价。 在sklearn中使用各种模型时都用了一种统一的样式,基本上都是先用 进行训练,然后用 进行预测。 对于线性回归模型,其数学模型基本上类似: 这里我们只提供了三个属性(x1, x2, x3)作为示例进行描述,在 阅读全文
posted @ 2017-12-19 10:39 dreampursuer 阅读(579) 评论(0) 推荐(0) 编辑
摘要: 在做机器学习时需要有数据进行训练,幸好sklearn提供了很多已经标注好的数据集供我们进行训练。 本节就来看看sklearn提供了哪些可供训练的数据集。 这些数据位于datasets中,网址为:http://scikit-learn.org/stable/modules/classes.html#m 阅读全文
posted @ 2017-12-18 09:40 dreampursuer 阅读(1362) 评论(0) 推荐(0) 编辑
摘要: 直接上代码: 显示图为: 我们还想在这个图中增加等高线图: 这时显示为: 阅读全文
posted @ 2017-12-15 10:34 dreampursuer 阅读(850) 评论(0) 推荐(0) 编辑
摘要: 等高线图是在地理课中讲述山峰山谷时绘制的图形,在机器学习中也会被用在绘制梯度下降算法的图形中。 因为等高线的图有三个信息:x, y以及x,y所对应的高度值。 这个高度值的计算我们用一个函数来表述: 这个函数看起来挺复杂的,但我们这里只是为了能够获得一个高度值,因此其中函数代表什么意义不用关心,只要知 阅读全文
posted @ 2017-12-14 09:45 dreampursuer 阅读(1636) 评论(0) 推荐(1) 编辑
摘要: 柱状图在平常的图表中是非常常用的图,本节我们来看下如何来显示柱状图。 代码为: 显示的图为: 阅读全文
posted @ 2017-12-13 09:33 dreampursuer 阅读(891) 评论(0) 推荐(0) 编辑
摘要: 之前我们一直在讲述线段图,这次讲述散点图。 散点图的生成很简单,只要调用plt.scatter()函数就可以。 例如: 生成的图片为: 阅读全文
posted @ 2017-12-12 09:44 dreampursuer 阅读(424) 评论(0) 推荐(0) 编辑
摘要: 本节主要讲述如何对坐标轴的刻度字体大小以及背景色进行修改。 例如: 显示的图片为: 阅读全文
posted @ 2017-12-11 09:50 dreampursuer 阅读(511) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 10 下一页