单变量的线性回归问题(1)

1、Model representation

首先来看一个简单的学习算法—线性回归，通过对线性回归模型的分析可以了解有监督学习算法的过程。

　　先看一个房价预测的问题，我们利用一个城市的房价信息集，来预测房屋价格和房屋面积的关系。

　　根据图中信息，我们如何预测面积为1250的房屋的销售价格？很直接的方法就是在图中画一条尽可能满足各个点的直线，在找到1250在该线上对应的值。

这是一个简单的有监督学习算法，因为图中的点是确定的。有监督学习中会有一系列已知的数据，上面的例子中就是图中所对应的点，我们称这些已知的数据为训练集(training set)。算法的目的就是利用这些训练集预测房屋价格。

作如下定义：

m = 训练样本的个数；

　　x = 输入变量/特征；

　　y = 输出变量

(x,y)表示一个训练样本;

(x(i),y(i))表示第i个样本；

　　有监督学习算法的结构如下图

　　用大量的训练集对学习算法进行训练，学习算法最终的到一个描述x和y映射关系h。根据h可以预测任一给定x对应的y值。

　　算法的关键就是得到h

　　假设：h_theta(x) = theta0 =theta1x ，这是一个线性函数，当然根据实际情况我们也可以假设h为非线性。

2、cost function

posted @ 2016-03-30 19:10 youngshuo 阅读(313) 评论(0) 编辑收藏举报

刷新页面返回顶部

Youngshuo