西瓜书第二章学习笔记-下
第二章
- 比较验证
(1)假设检验
在包含m个样本的测试集上,泛化错误率为的学习器被测得测试错误率为
的概率是:
其中表示在m个样本中选出
个的取法个数。
在时,
在
时最大。
越大时
越小。
如在=0.3时,10个样本中测得3个被误分类的概率最大。m=10,
=0.3时,
假设≤
,则在置信度1-α的概率内所能观测到的最大错误率如下式。
即:的最大边界为
时可以使得式子成立。此时,若测试错误率小于临界值
,则可得出结论:在α显著度下,假设“
”不能被拒绝。