深度学习第一课

　　什么是深度学习？

AI→ML→DL

人工智能包括机器学习包括深度学习，深度学习起源于人工神经网络的研究

或者ML与DL是部分包含的关系

ML适合处理结构化数据，DL适合处理非结构化数据

　　什么是结构化数据，非结构化数据？

行与列之间有关系的叫结构化数据；没有关系的例如图片视频文本等，就是非结构化数据

深度学习应用领域广泛，比如计算机视觉，图像识别分类，自然语言处理

机器学习：通过已知的输入和输出进行训练，学习规则，得到模型函数映射，达到处理未知的输入

实际上是计算权重值的过程

　　神经网络中的感知器算法类似生物中的神经元

接收输入，权重处理后，是否达到刺激（阈值），决定是否激活该神经元，决定是否传递数据

感知器是神经网络起源的算法，具有指导意义

　　实现二分类

输入=》向量[x1, x2, x3, x4]=>样本

权重　　向量[w1, w2, w3, w4]

净输入，z=∑Wi Xi=w1*x1+w2*x2+w3*x3+w4*x4

与阈值θ相比，z>=θ或z<θ，得到转换结果，从而实现二分类

相比的这个转换函数用阶跃函数，称为激励函数（激活函数）

　　将θ调整为0

z = w1*x1+w2*x2+w3*x3+w4*x4 -θ

设b=-θ作为一个偏置

z = w1*x1+w2*x2+w3*x3+w4*x4 + b* x0

b作为w0，x0==1

z = w0*x0+w1*x1+w2*x2+w3*x3+w4*x4

增加了一个w0*x0

　　权重更新

感知器会根据输入样本数据不断更新权重，更新公式为

wj = wj + △wj　　　　　　　　　　　　　#wj = wj + del wj

△wj = η学习率*（y真实值-y预测值）*xj　　#del wj = eta*(y-y_hat)*xj

η为学习率决定更新幅度

对于del wj，如果预测值与真实值相同，就是del wj为0,

如果预测错误比真实值低，del wj为正，那么就会增加这个权重，反之减少

　　更新规则

　　实现步骤

1.对权重进行初始化，设置为0或很小

2.对训练集中每一个样本进行迭代，计算输出值（预测值）y

3.根据输出值y与真实值y，更新权重

4.循环步骤2，直到达到指定的次数（或完全收敛）

说明：如果两个类别线性可分，则感知器一定会收敛。如果线性不可分，则不一定会收敛。

程序示例

第二节课

posted @ 2019-03-30 11:08 鸡蛋JD 阅读(205) 评论(0) 编辑收藏举报

刷新页面返回顶部

鸡蛋JD