关于MATLAB处理大数据坐标文件2017528
第一次提交数据
增加了部分特征
3000数据测试中得分99
但是10万数据出现过拟化现象,正确率下降
总结:1.某些特征数据本身波动不大应该考虑放弃
2.一些特征虽然表面觉得差异显而易见,但是数据表达出来的结果不一定完美
第二次提交数据
这次提交的数据采用昨天提交的特征,并加入今天的得出的特征的其中一个,打算以不同的方式找出最佳配合
结果 分数降低7分
本次吸取经验教训,得出如下总结:1.继续寻找特征的最佳组合
2.训练集太少,端午前后必须扩大训练集