Coursera台大机器学习技法课程笔记07-Blending and Bagging
这一节讲如何将得到的feature或hypothesis组合起来用于预测。
1. 林老师给出了几种方法
在选择g时,需要选择一个很强的g来确保Eval最小,但如果每个g都很弱该怎么办呢
这个时候可以选择Aggregation的方式将这些若g组合起来,组合起来的G,既能feature transform又能regularization这一对矛盾的性质。
2.接着讲了用uniform blending的方式来classification或regression,并推导了使用uniform blending的好处:Eout更小
接着解释了上述不等式的物理意义:一个算法的期望表现,等于consensus的表现加上consensus期望的偏差,通过uniform blending来消除variance。
3.接下来讲的是linear blending.
采用这种方式的一个问题是overfitting。对此,林老师的建议是,选择的时候,blending要在validation上做。
下面仍然是介绍如何避免overfitting,可以用非线性model,但没听懂,泪。。。。
4.接下来讲的是如何得到不同的g。
接下来介绍了一种方法bootstrapping:为了得到不同的g,对数据资料进行放回抽取,对每小份资料进行学习得到g
这位博主也总结了下,可参考:http://blog.csdn.net/lg1259156776/article/details/46821389