摘要:
计算机视觉岗常见面试题 问题1:Softmax+Cross Entropy反向求导 问题2:BatchNorm层的详细解读(具体可以参考之后出版的百面深度学习2333) 作用: 使得每层的输入/输出分布更加稳定,避免参数更新和网络层次变深大幅度影响数据分布。从而使模型训练更稳定。 参数 β 和 γ的 阅读全文
摘要:
模型性能的度量 在监督学习中,已知样本 ,要求拟合出一个模型(函数),其预测值与样本实际值的误差最小。 考虑到样本数据其实是采样,并不是真实值本身,假设真实模型(函数)是,则采样值,其中代表噪音,其均值为0,方差为。 拟合函数的主要目的是希望它能对新的样本进行预测,所以,拟合出函数后,需要在测试集( 阅读全文