关于MATLAB处理大数据坐标文件2017528

第一次提交数据

增加了部分特征

3000数据测试中得分99


但是10万数据出现过拟化现象,正确率下降





总结:1.某些特征数据本身波动不大应该考虑放弃

   2.一些特征虽然表面觉得差异显而易见,但是数据表达出来的结果不一定完美

 

  第二次提交数据

 

   这次提交的数据采用昨天提交的特征,并加入今天的得出的特征的其中一个,打算以不同的方式找出最佳配合

   结果 分数降低7分

   本次吸取经验教训,得出如下总结:1.继续寻找特征的最佳组合

                 2.训练集太少,端午前后必须扩大训练集

 

posted @ 2017-05-28 14:14  jju_iipg  阅读(146)  评论(0编辑  收藏  举报