摘要:
学习数据得到模型的方法分为两种:生成方法和判别方法。 生成模型: 由数据学习得到联合概率分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测模型,即生成模型(Generative Model): 典型的生成模型:朴素贝叶斯、隐马尔可夫模型 注:输入和输出变量要求为随机变量。 判别模型: 由数据 阅读全文
摘要:
泛化能力 泛化误差 泛化误差上界 指的泛化误差的概率上界。两种学习方法的优劣,通常通过他们的泛化误差上界进行比较。 性质: 他是样本容量的函数:当样本容量增加时,泛化上界趋于0 他是假设空间容量的函数:假设空间容量越大,模型就越难学,泛化误差上界就越大。 例:二分类泛化误差上界 定理(泛化误差上界) 阅读全文