摘要:
多层感知机(multi perceptron,MLP)。对于普通的含隐藏层的感知机,由于其全连接层只是对数据做了仿射变换,而多个仿射变换的叠加仍然是一个仿射变换,即使添加更多的隐藏层,这种设计也只能与仅含输出层的单层神经网络等价。解决问题的一个方法是引入非线性变换,对隐藏变量使用非线性变化,然后作为 阅读全文
摘要:
内容太多,捡重要的讲。 在分类问题中,通常用离散的数值表示类别,这里存在两个问题。1.输出值的范围不确定,很难判断值的意义。2.真实标签是离散值,这些离散值与不确定的范围的输出值之间的误差难以衡量。 softmax运算符解决了这两个问题。它把输出值变成了值为正且和为1的概率分布。 对于一个分类问题, 阅读全文
摘要:
最近参加了伯禹教育的动手学习深度学习项目,现在对第一章(线性回归)部分进行一个总结。 这里从线性回归模型之从零开始的实现和使用pytorch的简洁两个部分进行总结。 损失函数,选取平方函数来评估误差,公式如下: 1)从零开始实现 首先设置真实的权重和偏差w,b。随机生成一个二维数组并由此生成对应的真 阅读全文