摘要: $P(|E_{in}-E_{out}|>\epsilon) \leq 2Me^{-2\epsilon^2N}$当M小时,能够保证Ein和Eout差不多,但是找不到比较小的Ein当M很大时,能找到比较小的Ein,但是不能保证Ein和Eout差不多所以,希望可以找到一个比较适合的M $m_H$表示和... 阅读全文
posted @ 2015-06-28 15:33 porco 阅读(687) 评论(0) 推荐(0) 编辑
摘要: 1.差的数据集的概念BAD D单个H,在抽出的样本(数据集上),满足$P(|E_{in}-E_{out}|>\epsilon)\leq 2e^{-2\epsilon^2N}$ 考虑以下情况,如果抽出的都是绿球(数据集D),此时$E_{in} =0 $,而实际上和$E_{out}$差别很大,此时称此数... 阅读全文
posted @ 2015-06-28 15:27 porco 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 统计学场景:一个罐子中有红球和绿球,红球比例$v$未知,数量未知,如何得到红球比例?方法---随机抽样N个球,在其中红球占比为$u$由hoeffding可以知道:$P(|u-v|>\epsilon)\leq 2e^{-2\epsilon^2N}$对应到机器学习分类问题:目标函数为$f(x)$,现要估... 阅读全文
posted @ 2015-06-28 15:23 porco 阅读(157) 评论(0) 推荐(0) 编辑
摘要: 题:如果资料D线性可分,PLA如何保证最后能得到最优解。 思路:假设$w_f$能够分割资料D,$w_{t+1}$经过更新$w_{t+1}=w_t + y_{n(t)}x_{n(t)}$后,与$w_f$更接近 两个向量更接近,则有$Z=\frac{w_f^Tw_t}{||w_f||||w_t||}$越... 阅读全文
posted @ 2015-06-28 15:18 porco 阅读(677) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2015-06-28 15:01 porco 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2015-06-28 14:57 porco 阅读(526) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2015-06-28 14:55 porco 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 三种收敛、中心极限定理、大数定理、delta方法 阅读全文
posted @ 2015-06-28 14:52 porco 阅读(128) 评论(0) 推荐(0) 编辑
摘要: A.对于连续随机变量来说,单个点的概率是没有意义的,都为0B.PDF值没有边界,可以大于1C.Q1,Q2(中分位),Q3分别为使F取得1/4,1/2,3/4的x值D.重要的离散分布 点分布、离散均匀分布【书中的{1,2,3,...k}不都取到,而是指1/2+1/3+1/6和为1的】 伯努... 阅读全文
posted @ 2015-06-28 14:50 porco 阅读(243) 评论(0) 推荐(0) 编辑
摘要: 分部积分法放射粒子符合possion分布,证明 阅读全文
posted @ 2015-06-28 14:48 porco 阅读(146) 评论(0) 推荐(0) 编辑