摘要: 目的:为了让训练效果更好 bagging:是一种并行的算法,训练多个分类器,取最终结果的平均值 f(x) = 1/M∑fm(x) boosting: 是一种串行的算法,根据前一次的结果,进行加权来提高训练效果 stacking; 是一种堆叠算法,第一步使用多个算法求出结果,再将结果作为特征输入到下一 阅读全文
posted @ 2019-01-17 13:16 python我的最爱 阅读(4048) 评论(0) 推荐(0) 编辑
摘要: 根据每一个特征分类后的gini系数之和除于总特征的gini系数来计算特征重要性 阅读全文
posted @ 2019-01-17 10:31 python我的最爱 阅读(10166) 评论(0) 推荐(0) 编辑
摘要: 1.GridSeach(RandomRegressor(), param_grid, cv=3) GridSearch第一个参数是算法本身, 第二个参数是传入的参数组合, cv表示的是交叉验证的次数 GridSearch 对给定的参数进行两两的组合搜索,比如参数为[1, 2, 3], [1, 2, 阅读全文
posted @ 2019-01-17 10:23 python我的最爱 阅读(1215) 评论(0) 推荐(0) 编辑
摘要: from sklearn import tree from sklearn.cross_validation import train_test_split # 数据拆分 train_x, test_x, train_y, test_y = train_test_split(housing.data, housing.target, test_size=0.1, random_state=42... 阅读全文
posted @ 2019-01-17 09:48 python我的最爱 阅读(497) 评论(0) 推荐(0) 编辑
摘要: from sklearn import tree from sklearn.datasets.california_housing import fetch_california_housing housing = fetch_california_housing() dtr = tree.Deci 阅读全文
posted @ 2019-01-17 09:35 python我的最爱 阅读(2007) 评论(0) 推荐(0) 编辑