Fork me on GitHub
摘要: Convolutional Neural Networks 使用全连接层的局限性: 图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。 对于大尺寸的输入图像,使用全连接层容易导致模型过大。 使用卷积层的优势: 卷积层保留输入形状。 卷积层通过滑动窗口将同一卷积核与不同 阅读全文
posted @ 2020-02-18 22:59 Rser_ljw 阅读(399) 评论(0) 推荐(0) 编辑
摘要: 卷积神经网络基础 本节我们介绍卷积神经网络的基础概念,主要是卷积层和池化层,并解释填充、步幅、输入通道和输出通道的含义。 二维卷积层 本节介绍的是最常见的二维卷积层,常用于处理图像数据。 二维互相关运算 二维互相关(cross-correlation)运算的输入是一个二维输入数组和一个二维核(ker 阅读全文
posted @ 2020-02-18 00:32 Rser_ljw 阅读(515) 评论(0) 推荐(0) 编辑
摘要: 梯度消失、梯度爆炸以及Kaggle房价预测 梯度消失和梯度爆炸 考虑到环境因素的其他问题 Kaggle房价预测 梯度消失和梯度爆炸 深度模型有关数值稳定性的典型问题是消失(vanishing)和爆炸(explosion)。 当神经网络的层数较多时,模型的数值稳定性容易变差。 假设一个层数为 的多层感 阅读全文
posted @ 2020-02-18 00:18 Rser_ljw 阅读(1593) 评论(0) 推荐(0) 编辑
摘要: 过拟合、欠拟合及其解决方案 过拟合、欠拟合的概念 权重衰减 丢弃法 模型选择、过拟合和欠拟合 训练误差和泛化误差 在解释上述现象之前,我们需要区分训练误差(training error)和泛化误差(generalization error)。通俗来讲,前者指模型在训练数据集上表现出的误差,后者指模型 阅读全文
posted @ 2020-02-18 00:16 Rser_ljw 阅读(1676) 评论(0) 推荐(0) 编辑