02 2020 档案

摘要:4. deep-learning-computaion 4.1 模型构造 4.1.1 继承Block来构造模型 Block类是nn模块里提供的一个模型构造类,我们可以继承它来定义我们想要的模型也可以继承它来构造层。 事实上,Sequential类继承自Block类。当模型的前向计算为简单串联各个层的 阅读全文
posted @ 2020-02-10 00:35 HaricotVert 阅读(217) 评论(0) 推荐(0)
摘要:其他问题 1. 模型选择、欠拟合和过拟合 1.1 训练误差和泛化误差 1.2 模型选择 1.2.1 验证数据集 1.2.2 \(K\) 折交叉验证 由于验证数据集不参与模型训练,当训练数据不够用时,预留大量的验证数据显得太奢侈。一种改善的方法是$K$折交叉验证(\(K\)-fold cross-va 阅读全文
posted @ 2020-02-06 21:53 HaricotVert 阅读(157) 评论(0) 推荐(0)
摘要:Multilayer-perceptron 1. mlp 多层感知机在单层神经网络的基础上引入了一到多个隐藏层。多层感知机的隐藏层中的神经元和输入层中各个输入完全连接,输出层中的神经元和隐藏层中的各个神经元也完全连接。 1.1 隐藏层 若对每个全连接层做仿射变换,无论添加多少隐藏层都仍然等价于仅含输 阅读全文
posted @ 2020-02-06 11:16 HaricotVert 阅读(503) 评论(0) 推荐(0)
摘要:Softmax Regression 1. softmax 回归 softmax 回归主要是解决分类问题,输出是离散值,区别于线性回归,输出单元从一个变成了多个。 注: 需要在notebook文件地址下打开jupyter notebook,如果在子文件夹 04 chapter-deep-learni 阅读全文
posted @ 2020-02-05 18:19 HaricotVert 阅读(232) 评论(0) 推荐(0)
摘要:Linear-regression 1. 线性回归 线性回归模型尽量写成矩阵形式进行计算。 为什么矩阵计算比循环快很多? 【知乎】因为通常的数学库,矩阵运算都是用BLAS、ATLAS之类的库。这些库中,矩阵运算都是优化过的(也就是说通常不会用两层循环来计算矩阵乘法,具体的计算方法请参考源代码)。 当 阅读全文
posted @ 2020-02-04 12:15 HaricotVert 阅读(416) 评论(0) 推荐(0)
摘要:Prerequisite 1. 环境配置 环境配置主要包括: 安装miniconda,创建虚拟环境 gluon 在该环境中安装 mxnet, d2lzh, jupyter, matplotlib, pandas 1.1 安装 miniconda,创建虚拟环境 直接在 miniconda 官网下载安装 阅读全文
posted @ 2020-02-03 16:30 HaricotVert 阅读(301) 评论(0) 推荐(0)