摘要: 今天我们离成功又近了一步,因为又失败了两次 第一次使用了所有特征,理由:前天的特征使用的是取单个特征测试超过85分的特征,结果出现过拟合现象。 本次使用所有特征是为了和昨天的结果作比较。 结果稍好:比最佳分数多了1分 第二次使用了上一次最佳结果的特征,去除其中单个特征测试结果最好的,加入新的特征,加 阅读全文
posted @ 2017-05-29 20:31 jju_iipg 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 第一次提交数据增加了部分特征 3000数据测试中得分99但是10万数据出现过拟化现象,正确率下降总结:1.某些特征数据本身波动不大应该考虑放弃 2.一些特征虽然表面觉得差异显而易见,但是数据表达出来的结果不一定完美 第二次提交数据 这次提交的数据采用昨天提交的特征,并加入今天的得出的特征的其中一个, 阅读全文
posted @ 2017-05-28 14:14 jju_iipg 阅读(144) 评论(0) 推荐(0) 编辑
摘要: 第一次提交数据: 今天用了8个特征,加上的这一个特征是 从3000条测试数据中测试失败的数据总结出来的树的数目为50再次使用3000条测试数据测试结果—— 结果不错: 99%但是运行官网数据结果分数——降低0.5 为58.55分总结:总特征数目为8,树的数目远远超过特征数,以后树的数目不能多于特征的 阅读全文
posted @ 2017-05-27 16:58 jju_iipg 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 运行六个特征,提高了3分,也就是说以前做的特征已经用完了,穷途末路,依靠以前的特征已经很难取得进步了,提出以下建议 1.测试集曾经运行错误的数据尽早画出图形,并尽可能发现问题并提出特征 2.运行其他程序测试数据 决策树、SVM等 3.不拘泥大赛给的数据 阅读全文
posted @ 2017-05-26 22:13 jju_iipg 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 原先有3000条测试数据,MATLAB表现出来强大的数据处理能力,十几秒就可以把数据分类、分装并储存,这次共有10万条坐标数据,MATLAB明显后劲不足,显示内存不足 自我认识:以前MATLAB数据处理是手动将数据导入mat表格,再由程序运行表格数据,但是这次运行光坐标压缩文件就有35兆,就算导入成 阅读全文
posted @ 2017-05-26 09:15 jju_iipg 阅读(579) 评论(0) 推荐(0) 编辑
摘要: 一、 基础语法 1.Print print 是 python 里很基本很常见的一个操作,它的操作对象是一个字符串。 直接在 print 后面加一段文字来输出的话,需要给文字加上双引号或者单引号。大家应该发现了,print 除了打印文字之外,还能输出各种数字、运算结果、比较结果等。 2.输入 前面我们 阅读全文
posted @ 2017-05-08 16:28 jju_iipg 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 首先声明一点,以前装过的Python如果不用了,卸载的干净一点,一台电脑只能装一个Python,并且你能保证以前那些包不互相影响吗 今天在这里分享一下Python入门,几乎每一个学习Python的人都会说--经历了九牛二虎之力才把Python装好,这里分享一下本人心得,让大家少走弯路 成功安装一个P 阅读全文
posted @ 2017-04-25 22:09 jju_iipg 阅读(222) 评论(0) 推荐(0) 编辑