(CS229)监督学习应用和梯度下降

监督学习：基于标记数据的学习

监督学习又举了两个例子：回归问题regression在连续数据上的模型构建问题和分类问题 classification 在离散数据上的问题

无监督学习：未标记的学习经典方法是聚类cluster

应用：使用聚类算法对图像进行处理，聚类处理，使图像更为明显像素分组；

使用聚类算法将图像分成不同的部分计算机集群组织消费人群的划分星系的组成

鸡尾酒会问题：多人说话的情况下那个人的声音从声音中分离出来可使用无监督学习的方法

强化学习：利用监督学习进行预测；通过评价函数，决定作出的决策是否是正确的，通常做出一系列的决策；飞行控制器使用的就是强化学习
如何定义一个好的行为和一个坏的学习通过学习性算法进行控制。

定义：

$m$为训练数据大小

$x$为输入变量，是向量

$y$为输出变量，是实数

$(x,y)$为一个训练实例

$(x^{i},y^{i})$是第i个训练实例，i是上标；

为了方便说明，又添加了一个变量，问题变为房屋面积和卧室数目(可以理解为向量由两个参数组成)与房屋价格的关系

训练集中的数据使用线性回归问题进行解决：

$h(x)=\theta_{0}+\theta_{1}x_{1}+\theta_{2}x_{2}=\sum_{i=0}^{2}\theta_{i}x_{i}=h_{\theta}(x)$

其中，$h_{\theta}(x)$ 表示以$\theta$为参数的。公式如下：

$h_{\theta}(x)=\sum_{i=0}^{n}\theta_{i}x_{i}=\theta^{T}x$ ==》单个样本的前向推导，也看看作是矩阵的相乘，x由多个变量组成，相应的定义多个参数$\theta$进行线性相乘再累加，相当于进行加权求和，得到输入向量对应于的输出变量的表征，不同的特征具有不同的权重$\theta$。

x是向量，n是x的长度，从而定义目标函数

$J(\theta)=1/2\sum_{i=0}^{m}(h_{\theta}(x^(i))-y^{i})^2$ ==》对整个数据集m 进行优化，使用了平方损失，前面加上一个1/2方便BP时反向的求导，加快计算。

posted @ 2019-08-01 15:17 陈柯成阅读(193) 评论(0) 编辑收藏举报

刷新页面返回顶部

陈柯成

(CS229)监督学习应用和梯度下降

公告