关于MATLAB处理大数据坐标文件2017527

第一次提交数据:

今天用了8个特征,加上的这一个特征是 从3000条测试数据中测试失败的数据总结出来的
树的数目为50
再次使用3000条测试数据测试结果—— 结果不错: 99%
但是运行官网数据结果分数——降低0.5      为58.55分



总结:总特征数目为8,树的数目远远超过特征数,以后树的数目不能多于特征的1.5倍,否则结果很难得出结论,无说服力

 

 

第二次提交数据:

本次使用9个特征,加上的特征是 从3000条测试数据中测试失败的数据总结出来的

树的数目为12

使用3000条测试数据测试结果—— 结果不错: 99%

运行官网数据结果分数有所提升

 

总结:总特征数目为9,树的数目12,正确率上升,事实说明 :一个没有特征的决策树会也会抽取数据训练 , 最终也会对随机森林最终结果产生影响

        那么继续观察以前的失败数据,提取新的特征

 

posted @ 2017-05-27 16:58  jju_iipg  阅读(151)  评论(0编辑  收藏  举报