TensorFlow2_200729系列---4、手写数字识别理论
TensorFlow2_200729系列---4、手写数字识别理论
一、总结
一句话总结:
手写识别数字中,最开始由784(28*28)维降到最后输出的10(10类输出)维,每一层神经网络降一次维
1、p(y=1|x)=0.8表示什么意思:out:[0.1,0.8,0.02,0.08]?
在x的条件下,y=1(也就是y是索引为1那号物品)的概率是0.8
2、手写识别数字中,输出肯定是10个数字,所以对应输出肯定是10类,而手写的图片是28*28,那么怎么构建线性模型中的w和b?
A、out = x@w+b
B、X:[b, 784] W:[784, 10] b:[10]
C、out:[b, 10]
3、手写识别数字中,怎么由784(28*28)维降到10(10类输出)?
a、不断降维,线性相乘的过程也就是不断降维的过程out = x@w+b(B、X:[b, 784] W:[784, 10] b:[10] )
b、经过多次,就可以降到10维了,h1 = relu(x@w+b),h2 = relu(h1@w2 + b)
4、MSE(mean-square error)?
均方误差,就是最小二乘法那个类似的公式
二、手写数字识别理论
转自或参考:
版权申明:欢迎转载,但请注明出处
一些博文中有一些参考内容因时间久远找不到来源了没有注明,如果侵权请联系我删除。
在校每年国奖、每年专业第一,加拿大留学,先后工作于华东师范大学和香港教育大学。
2025-04-30:宅加太忙,特此在网上找女朋友,坐标上海,非诚勿扰,vx:fan404006308
AI交流资料群:753014672