摘要:
1.正则化 模型选择的典型方法是正则化。正则化是结构风险最小策略的实现,是在经验风险上加一个正则化项。正则化项一般是模型复杂度的单调递增函数。正则化的作用是选择经验风险与模型复杂度同时小的模型。 扁平稀疏(Flat sparsity): the flat sparsity is often achi 阅读全文
摘要:
矩阵求导公式 基本公式:Y = A * X --> DY/DX = AT, Y = X * A --> DY/DX = A Y=XT*A--> DY/DX = A Y = A * X--> DYT/DX = AT Y = A * X -->DY/DXT = (DYT/DX)T=A Y = AT * 阅读全文