摘要:
正则化: 正则化是结构风险最小化策略的实现,是在经验风险上加上一个正则化项或罚项。正则化项一般是模型复杂度的单调递增函数,模型越复杂,正则化值就越大。比如正则化项可以是模型参数向量的范数。 正则化的作用: 选择经验风险与模型复杂度同时较小的模型 交叉验证: 在数据充足的情况下,会直接将数据分为训练集 阅读全文
摘要:
GSDMM是一种基于狄利克雷多项式混合模型的收缩型吉布斯采样算法(a collapsed Gibbs Sampling algorithm for the Dirichlet Multinomial Mixture model)的简称,它是发表在2014年KDD上的论文《A Dirichlet Mu 阅读全文
摘要:
Q1 监督学习与无监督学习 监督学习:通常是分类,通过已有的训练样本,即已知数据及其对应的输出,去训练一个最优模型。再利用这个模型对所有的数据映射相应的输出。对输出进行简单的判断从而实现分类的目的,也就具有了对未知数据进行分类的能力。 无监督学习: 我们事先没有任何训练样本,而需要直接对数据进行建模 阅读全文
摘要:
更简便如下: $\overline r_a + \frac{\sum_{b\in N}\quad sim(a, b)*(r_{b, P}\qquad - \overline r_{\qquad b})}{\sum_{b\in N} \quad sim(a, b)}$ 阅读全文
摘要:
看到网上有个更简便的 阅读全文