1、http://www.kaggle.com/ 数据挖掘竞赛
2、ensemble 会stable,因为 single model一般会overfit
3、最近邻KNN看一下
4、random forest Leo Breiman
http://en.wikipedia.org/wiki/Random_forest