摘要: 自定义损失函数 当训练回归模型时,训练集有噪声,均方误差MSE可能会对大误差惩罚太多而导致模型不精确。平均绝对误差MAE不会对异常值惩罚太多,但是训练可能要一段时间才能收敛,并且训练后的模型可能不太精确。这就是使用Huber损失而不是旧的MSE损失的好时机。 $$L_\delta(y,f(x))== 阅读全文
posted @ 2021-10-16 23:19 里列昂遗失的记事本 阅读(383) 评论(0) 推荐(0) 编辑
摘要: Python 3引入的不可变bytes类型和Python 2.6添加的可变bytearray类型 bytes和bytesarray对象的各个元素是介于0-255(含)之间的整数,而不像Python 2 的str对象那样是单个的字符。然而,二进制序列的切片始终是同一种类型的二进制序列,包含长度为1的切 阅读全文
posted @ 2021-10-10 21:20 里列昂遗失的记事本 阅读(40) 评论(0) 推荐(0) 编辑
摘要: 编码与解码 “字符串”是个相当简单的概念:一个字符串是一个字符序列。问题出在“字符”的定义上。在2015年,“字符”的最佳定义是Unicode字符。因为,从Python3的str对象中获取的元素是Unicode字符,这相当于从Python2的unicode对象中获取的元素,而不是Python2的st 阅读全文
posted @ 2021-10-10 10:00 里列昂遗失的记事本 阅读(33) 评论(0) 推荐(0) 编辑
摘要: 张量和操作 可以使用tf.constant()创建张量 from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity='all' import tensorflow 阅读全文
posted @ 2021-10-09 20:46 里列昂遗失的记事本 阅读(135) 评论(0) 推荐(0) 编辑
摘要: Tensorflow快速浏览 高级深度学习API tf.keras tf.estimator 底层深度学习API tf.nn tf.losses tf.metrics tf.optimizers tf.train tf.initializers 自动微分 tf.GradientTape tf.gra 阅读全文
posted @ 2021-10-09 10:40 里列昂遗失的记事本 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 梯度下降 线性模型 $\hat{y}=x*w$来拟合学习时间$x$与考试分数$y$ \[ loss=(\hat{y}-y)^2=(x*w-y)^2\to cost=\frac1N\sum^N_{n=1}(\hat{y_n}-y_n)^2 \] 由图可知损失函数在$w=2.0$时,取得最小值。记损失函 阅读全文
posted @ 2021-10-08 19:41 里列昂遗失的记事本 阅读(75) 评论(0) 推荐(0) 编辑
摘要: Linear Model 机器学习 $x$为学习时间,$y$为学习该时间能够在考试中取得的分数 在这里来为这些数据寻求一个最好的模型 线性回归 Linear Model:\(\hat{y}=x*w\) 训练损失 (误差) MSE(Mean Squared Mean)均方误差: \[ loss=(\h 阅读全文
posted @ 2021-10-08 18:30 里列昂遗失的记事本 阅读(59) 评论(0) 推荐(0) 编辑
摘要: 通过正则化避免过拟合。 深度神经网络通常拥有数万个参数,有时甚至有数百万个。这个深度神经网络带来了难以置信的自由度,意味着它们可以拟合各种各样的复杂数据集。 但是这种巨大的灵活性也使网络易于过拟合训练集。此时就需要正则化。 $\ell_1$和$\ell_2$正则化 可以使用$\ell_2$正则化来约 阅读全文
posted @ 2021-10-03 10:39 里列昂遗失的记事本 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 动量优化 想象一下,一个保龄球在光滑的表面上沿着平缓的坡度滚动:它开始速度很慢,在很快会获得动量,直到最终达到终极速度(如果有摩擦或空气阻力)。相比之下,常规的梯度下降法只是在斜坡上采取小的、常规的步骤,因此算法将花费更多时间到达底部 回想一下梯度下降通过直接减去权重的成本函数$J(\theta)\ 阅读全文
posted @ 2021-09-30 09:13 里列昂遗失的记事本 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 用Keras进行迁移学习 假如Fashion MNIST数据集包含了8个类别,例如,除凉鞋和衬衫之外的所有类别。有人在该数据集上建立并训练的Keras模型,并获得了相当不错的性能(精度>90%)。将此模型称为模型A。现在要处理另一项任务:有凉鞋和衬衫的图像,想要训练一个二元分类器(正=衬衫,负=凉鞋 阅读全文
posted @ 2021-09-28 20:15 里列昂遗失的记事本 阅读(57) 评论(0) 推荐(0) 编辑