摘要: 梯度消失、梯度爆炸以及Kaggle房价预测 1. 梯度消失和梯度爆炸 2. 考虑到环境因素的其他问题 3. Kaggle房价预测 梯度消失和梯度爆炸 深度模型有关数值稳定性的典型问题是消失(vanishing)和爆炸(explosion)。 当神经网络的层数较多时,模型的数值稳定性容易变差。 假设一 阅读全文
posted @ 2020-02-15 21:50 hichens 阅读(273) 评论(0) 推荐(0) 编辑
摘要: 今日学习 pytorch 学习 图像处理笔记整理 阅读 pytorch笔记 "过拟合、欠拟合及其解决方案" "梯度消失、梯度爆炸以及Kaggle房价预测" 图像处理笔记整理 阅读全文
posted @ 2020-02-15 16:39 hichens 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 循环神经网络 本节介绍循环神经网络,下图展示了如何基于循环神经网络实现语言模型。我们的目的是基于当前的输入与过去的输入序列,预测序列的下一个字符。循环神经网络引入一个隐藏变量$H$,用$H_{t}$表示$H$在时间步$t$的值。$H_{t}$的计算基于$X_{t}$和$H_{t 1}$,可以认为$H 阅读全文
posted @ 2020-02-14 20:33 hichens 阅读(401) 评论(0) 推荐(0) 编辑
摘要: 语言模型 一段自然语言文本可以看作是一个离散时间序列,给定一个长度为$T$的词的序列$w_1, w_2, \ldots, w_T$,语言模型的目标就是评估该序列是否合理,即计算该序列的概率: $$ P(w_1, w_2, \ldots, w_T). $$ 本节我们介绍基于统计的语言模型,主要是$n$ 阅读全文
posted @ 2020-02-14 20:32 hichens 阅读(423) 评论(0) 推荐(0) 编辑
摘要: 文本预处理 文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤: 1. 读入文本 2. 分词 3. 建立字典,将每个词映射到一个唯一的索引(index) 4. 将文本从词的序列转换为索引的序列,方便输入模型 读入文本 我们用一部英文小说 阅读全文
posted @ 2020-02-14 20:20 hichens 阅读(1422) 评论(0) 推荐(0) 编辑
摘要: 多层感知机 1. 多层感知机的基本知识 2. 使用多层感知机图像分类的从零开始的实现 3. 使用pytorch的简洁实现 多层感知机的基本知识 深度学习主要关注多层模型。在这里,我们将以多层感知机(multilayer perceptron,MLP)为例,介绍多层神经网络的概念。 隐藏层 下图展示了 阅读全文
posted @ 2020-02-14 19:58 hichens 阅读(3348) 评论(0) 推荐(0) 编辑
摘要: softmax和分类模型 内容包含: 1. softmax回归的基本概念 2. 如何获取Fashion MNIST数据集和读取数据 3. softmax回归模型的从零开始实现,实现一个对Fashion MNIST训练集中的图像数据进行分类的模型 4. 使用pytorch重新实现softmax回归模型 阅读全文
posted @ 2020-02-14 19:21 hichens 阅读(1114) 评论(1) 推荐(1) 编辑
摘要: 线性回归 主要内容包括: 1. 线性回归的基本要素 2. 线性回归模型从零开始的实现 3. 线性回归模型使用pytorch的简洁实现 线性回归的基本要素 模型 为了简单起见,这里我们假设价格只取决于房屋状况的两个因素,即面积(平方米)和房龄(年)。接下来我们希望探索价格与这两个因素的具体关系。线性回 阅读全文
posted @ 2020-02-14 09:53 hichens 阅读(271) 评论(0) 推荐(0) 编辑
摘要: 今日学习 深度学习刷视频 3h 图像处理笔记整理《运动对象检测和描述》 3h 阅读《1984》 2h 深度学习刷视频笔记 "深度学习刷视频笔记" 图像处理代码 "图像处理代码" 阅读完成 所谓的自由就是可以说二加二等于四的自由。 阅读全文
posted @ 2020-02-14 09:05 hichens 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 今日学习 ML代码 CV笔记 深度学习刷视频 ML代码地址 "ML代码地址" CV笔记地址 "CV笔记地址" 阅读全文
posted @ 2020-02-13 22:20 hichens 阅读(151) 评论(0) 推荐(0) 编辑