1-1 深度学习概述

什么是神经网络

假如我们要建立房价的预测模型，我们已知模型输入面积 x 及输出价格 y ，来预测房价：y = f(x)，我们用一条直线来拟合图中这些离散点（建立房价与面积的线性模型）。

这个简单的模型（蓝色折线）就是一个最简单的神经网络。

该神经网络的输入 x 是房屋面积，输出 y 是房价，中间包含了一个神经元（neuron），即房价预测函数（蓝色折线），该神经元的功能就是实现函数f(x)的功能。

除了考虑房屋面积（size）之外，我们还考虑卧室数目（bedrooms），房屋的邮政编码（zip code/postal code），还有地区财富水平（wealth）。因此，这个神经网络有四个输入，分别是size，bedrooms，zip code和wealth。

其中 x1 所在的位置称之为输入层，三个神经元所在的位置称之为中间层或者隐藏层，y 所在的位置称之为输出层。这就是基本的神经网络模型结构。

神经网络非常擅长计算从 x到y的精准映射。

监督学习与非监督学习本质区别就是是否已知训练样本的输出 y，也就是样本是否含标签信息。

下面是几个监督式学习在神经网络中应用的例子：

1）房价预测：输入 x 是房屋的各种参数，输出是房价；

2）在线广告：输入 x 是广告和用户个人信息，输出是用户是否对广告进行点击；

3）计算机视觉：输入 x 是图片像素值，输出是图片所属的不同类别等；

4）语音识别：输入 x 是一段语音信号，输出是文字信息；

5）机器翻译：输入 x 是一种语言，输出是表达相同意思的另一种语言；

6）自动驾驶：输入 x 一张图片或者汽车雷达信息等，输出是相应的路况信息并作出相应的决策等。

这里写图片描述

不同的情况，一般使用不同的网络模型：

1）对于一般的监督学习（房价预测和在线广告），我们使用标准的神经网络模型；

2）对于计算机视觉处理问题，我们使用CNN（Convolution Neural Network）；

3）对于语音这样的时序信号处理，我们使用RNN（Recurrent Neural Network）。

这里写图片描述

数据类型一般分为两种：结构化数据和非结构化数据。结构化数据意味着数据的基本数据库。

这里写图片描述

结构化数据：例如房价预测中的size，bedrooms，price等；在线广告中的User Age，Ad ID等。这写都是结构化数据，意思是每个特征，比如说房屋大小卧室数量，或者是一个用户的年龄，都有一个很好的定义。

非结构化数据：例如声音、图像或者文本等。

尤其是在非结构化数据上，深度学习方法更能展示相对于其他方法的优越性，更能创造出巨大的实用价值。

如下图所示，横坐标 x 表示数据量（Amount of data），纵坐标 y 表示机器学习模型的性能表现（Performance）。

这里写图片描述

图中共有 4 条曲线。

1、红色曲线代表了传统机器学习算法的表现，它在数据量很大的时候表现很一般；

2、黄色曲线代表了规模较小的神经网络模型（Small NN），它在数据量较大时候的性能优于传统的机器学习算法；

3、蓝色曲线代表了规模中等的神经网络模型（Media NN），它在数据量更大的时候的表现比Small NN更好；

4、绿色曲线代表更大规模的神经网络（Large NN），它在数据量更大的时候的表现比Media NN更好，并且保持了快速上升的趋势。

可以看出，更复杂的深度学习模型，对海量数据的处理和分析更有效。其原因是：可供使用来训练的样本数据量呈几何级数增加、训练服务器使用计算力极强的GPU架构以及近年来学术界更多的算法上的创新和改进。

posted @ 2018-08-11 18:00 刘-皇叔阅读(1690) 评论(0) 编辑收藏举报

刷新页面返回顶部