摘要:1、虽然叫做回归,但是实际做的是分类任务 2、softmax函数重要的两点 2.1、预测结果为0—1之间的数,为非负数 2.2、预测结果之和为1 3、解释 3.1、针对特性1作解释 softmax公式如下: 可以看到对每个X都做了指数运算,我们都知道指数运算没有非负数,因此结果会变成正数。 3.2、
阅读全文
摘要:1、报错信息: normal() received an invalid combination of arguments - got (int, float, reguires_grad=bool, size=tuple), but expected one of: * (Tensor mean,
阅读全文
摘要:1、定义 真实值与预测值之间的差值 2、常见的损失函数 2.1、均方损失/L2 Loss 2.2、Huber 鲁棒损失函数 当预测值和真实值离得很近时为平法误差;离得较远时为绝对值误差。 2.3、交叉熵损失函数
阅读全文
摘要:1、学习率 1.1、学习率取值要适当 当学习率很低的时候,跑了多次损失还是很大,此时需要加大迭代次数,浪费计算资源。 当学习率很大的时候,loss可能为nan,因为求导的时候可能会除以0。 1.2、优化算法如何找到合适的学习率 方法一: 找一个对学习率不敏感的算法,如:Adam 方法二: 合理的参数
阅读全文
摘要:1、李沐大神创建的库,里面包括了一些我们常用的库和自定义函数。 2、ModuleNotFoundError: No module named ‘d2l’ 解决:没有这个库,使用管理员方式打开Anaconda prompt,然后输入下面代码 pip install -U d2l --user 3、No
阅读全文