机器学习的可行性
霍夫丁不等式:
当样本N足够大时,μ和v相差很大的可能性很小。(需要合适的N和误差,N越大,μ和v接近的几率越大;且不需要知道μ)
证明了可由小样本的v推出μ。
用D检验h,即x是否与f相同(监督式学习x还会有标签y)
流程
从罐子中取样,得到一个概率P(g与f相同的概率),有两个用途:1.产生资料D(有x,y),2.来验证从H抽出的g是否接近f
E(in):抽出的弹珠;E(out):罐子里的弹珠
因此,通过已知的资料验证g是否接近f,即E(in)可推出未知的E(out)
在有选择时,会增大E(in)和E(out)相差很大的概率
Bad Date:E(in)很小,但E(out)很大,如硬币连续五次反面
因此,选出E(in)最小的作为g
总结