(CS229)监督学习应用和梯度下降

监督学习:基于标记数据的学习

监督学习又举了两个例子:回归问题regression在连续数据上的模型构建问题  和 分类问题 classification 在离散数据上的问题

无监督学习:未标记的学习 经典方法是聚类cluster

 应用:使用聚类算法对图像进行处理,聚类处理,使图像更为明显像素分组;

            使用聚类算法将图像分成不同的部分 计算机集群组织 消费人群的划分 星系的组成

            鸡尾酒会问题: 多人说话的情况下 那个人的声音从声音中分离出来 可使用无监督学习的方法

 

强化学习: 利用监督学习进行预测; 通过评价函数,决定作出的决策是否是正确的,通常做出一系列的决策; 飞行控制器使用的就是强化学习
如何定义一个好的行为和一个坏的学习 通过学习性算法进行控制。

 

 

定义:

$m$为训练数据大小

$x$为输入变量,是向量

$y$为输出变量,是实数

$(x,y)$为一个训练实例

$(x^{i},y^{i})$是第i个训练实例,i是上标;

为了方便说明,又添加了一个变量,问题变为房屋面积和卧室数目(可以理解为向量由两个参数组成)与房屋价格的关系

 

训练集中的数据使用线性回归问题进行解决:

$h(x)=\theta_{0}+\theta_{1}x_{1}+\theta_{2}x_{2}=\sum_{i=0}^{2}\theta_{i}x_{i}=h_{\theta}(x)$

其中,$h_{\theta}(x)$ 表示以$\theta$为参数的。公式如下:

$h_{\theta}(x)=\sum_{i=0}^{n}\theta_{i}x_{i}=\theta^{T}x$  ==》单个样本的前向推导,也看看作是矩阵的相乘,x由多个变量组成,相应的定义多个参数$\theta$进行线性相乘再累加,相当于进行加权求和,得到输入向量对应于的输出变量的表征,不同的特征具有不同的权重$\theta$。

x是向量,n是x的长度,从而定义目标函数

$J(\theta)=1/2\sum_{i=0}^{m}(h_{\theta}(x^(i))-y^{i})^2$ ==》对整个数据集m 进行优化,使用了平方损失,前面加上一个1/2方便BP时反向的求导,加快计算。

 

posted @ 2019-08-01 15:17  陈柯成  阅读(193)  评论(0编辑  收藏  举报