关于MATLAB处理大数据坐标文件2017527
第一次提交数据:
今天用了8个特征,加上的这一个特征是 从3000条测试数据中测试失败的数据总结出来的
树的数目为50
再次使用3000条测试数据测试结果—— 结果不错: 99%
但是运行官网数据结果分数——降低0.5 为58.55分
总结:总特征数目为8,树的数目远远超过特征数,以后树的数目不能多于特征的1.5倍,否则结果很难得出结论,无说服力
第二次提交数据:
本次使用9个特征,加上的特征是 从3000条测试数据中测试失败的数据总结出来的
树的数目为12
使用3000条测试数据测试结果—— 结果不错: 99%
运行官网数据结果分数有所提升
总结:总特征数目为9,树的数目12,正确率上升,事实说明 :一个没有特征的决策树会也会抽取数据训练 , 最终也会对随机森林最终结果产生影响
那么继续观察以前的失败数据,提取新的特征