1、http://www.kaggle.com/ 数据挖掘竞赛

2、ensemble 会stable,因为 single model一般会overfit

3、最近邻KNN看一下

4、random forest  Leo Breiman 

http://en.wikipedia.org/wiki/Random_forest