摘要:
1、http://www.kaggle.com/ 数据挖掘竞赛2、ensemble 会stable,因为 single model一般会overfit3、最近邻KNN看一下4、random forest Leo Breimanhttp://en.wikipedia.org/wiki/Random_forest 阅读全文
摘要:
1、为什么要分training set和test set?就像考试,如果只考平时讲过的,无法判断这个learner的真实水平。需要拿一些不讲的用于test,用来测试这个learner。Training set 训练weight,比如w;validation set :tune hyper parameter,比如正则项中的lamda ,model 的阶数等validation error指?Test set 来衡量模型注:后面说的test set 指validation set2、分了training set 和test set以后,用于训练的数据少了,怎么办?2.1对于model来说,数据越 阅读全文