微信扫一扫打赏支持

TensorFlow2_200729系列---4、手写数字识别理论

TensorFlow2_200729系列---4、手写数字识别理论

一、总结

一句话总结：

手写识别数字中，最开始由784（28*28）维降到最后输出的10（10类输出）维，每一层神经网络降一次维

1、p(y=1|x)=0.8表示什么意思：out:[0.1,0.8,0.02,0.08]？

在x的条件下，y=1（也就是y是索引为1那号物品）的概率是0.8

2、手写识别数字中，输出肯定是10个数字，所以对应输出肯定是10类，而手写的图片是28*28，那么怎么构建线性模型中的w和b？

A、out = x@w+b

B、X:[b, 784] W:[784, 10] b:[10]

C、out:[b, 10]

3、手写识别数字中，怎么由784（28*28）维降到10（10类输出）？

a、不断降维，线性相乘的过程也就是不断降维的过程out = x@w+b（B、X:[b, 784] W:[784, 10] b:[10] ）

b、经过多次，就可以降到10维了，h1 = relu(x@w+b)，h2 = relu(h1@w2 + b)

4、MSE（mean-square error）？

均方误差，就是最小二乘法那个类似的公式

二、手写数字识别理论

转自或参考：

posted @ 2020-08-01 06:29 范仁义阅读(204) 评论(0) 收藏举报

刷新页面返回顶部