摘要:
一、概括: L1和L2是正则化项,又叫做罚项,是为了限制模型的参数,防止模型过拟合而加在损失函数后面的一项。 二、区别: 1.L1是模型各个参数的绝对值之和。 L2是模型各个参数的平方和的开方值。 2.L1会趋向于产生少量的特征,而其他的特征都是0. 因为最优的参数值很大概率出现在坐标轴上,这样就会 阅读全文
摘要:
Batch Normalization作为最近一年来DL的重要成果,已经广泛被证明其有效性和重要性。虽然有些细节处理还解释不清其理论原因,但是实践证明好用才是真的好,别忘了DL从Hinton对深层网络做Pre-Train开始就是一个经验领先于理论分析的偏经验的一门学问。本文是对论文《Batch No 阅读全文
摘要:
传统的基于CNN的人脸识别方法为: 1. 利用CNN的siamese网络来提取人脸特征 2. 然后利用SVM等方法进行分类 facnet亮点 1. 利用DNN直接学习到从原始图片到欧氏距离空间的映射,从而使得在欧式空间里的距离的度量直接关联着人脸相似度; 2. 引入triplet损失函数,使得模型的 阅读全文