06 2017 档案

摘要:今天我们提交了两次数据,第一次是11929条,成绩为76.35;第二次是12291条,成绩为77.38;我们通过将那几个新特征慢慢加进去,和将原来一些特征增删之后得出这次结果。我们从之前,到现在在筛选特征的过程中发现:在一个比较理想的特征组加入某个新特征后,数据值降低,用另一个新特征代替那个特征之后 阅读全文
posted @ 2017-06-30 20:13 jju_iipg 阅读(160) 评论(0) 推荐(0)
摘要:数据归一化 数据的标准化是将数据按比例缩放,使之落入一个小的特定区间,一般为0到1之间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。 常见的数据归一化的方法有: 1.min-max标准化(离差标准化) 是对原始数据 阅读全文
posted @ 2017-06-29 22:45 jju_iipg 阅读(295) 评论(0) 推荐(0)
摘要:总结一下现在的情况: 特征数目很少 训练数据很少 改进算法 但是作为刚刚入门Python的新手来说,更改算法等于扒皮抽筋——太难,所以目前算法方面继续探索,但是特征提取不能止步,而且抓紧时间把训练数据提上去 阅读全文
posted @ 2017-06-28 22:39 jju_iipg 阅读(136) 评论(0) 推荐(0)
摘要:现在我们已经用wxpython制作一个gui程序,目前它只能用于筛选有用的特征组。我们知道好的特征是非常重要,但有用的特征组是同等重要,这个工具可以使我们更加迅速的筛选有用的特征组合,大大节约我们的时间,而且操作起来非常简单。 这个工具的缺点是:从几十个特征中筛选出十个特征速度为最优,如果特征数增加 阅读全文
posted @ 2017-06-27 21:26 jju_iipg 阅读(224) 评论(0) 推荐(0)
摘要:首先需要设计一个用户图形界面的函数,这个图形界面被用于在其上面绘制轨迹并记录当时的坐标。 该回响函数应包含:鼠标按下时,鼠标移动时,和鼠标释放时的反应命令。当然网上有有相关的开源 程序,但是有缺陷(该程序只能记录当时的点的坐标,无法记录整个轨迹坐标,更不用说同时记录多条轨迹)。 这时,这用在func 阅读全文
posted @ 2017-06-25 13:21 jju_iipg 阅读(1440) 评论(0) 推荐(0)
摘要:在我们比赛的算法中,我们使用了交叉验证方法来筛选比较重要的特征,现在我们来了解一下什么是交叉验证(Cross-Validation):有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为 阅读全文
posted @ 2017-06-24 19:26 jju_iipg 阅读(342) 评论(0) 推荐(0)
摘要:经过一个下午找资料,已作出人工轨迹记录程序,这样就可以增加样本容量 接下来三个方向:特征、决策树、机械轨迹程序 虽然机械轨迹的程序相对好做,但是现有机械轨迹程序太过于死板,不能自行更改轨迹 阅读全文
posted @ 2017-06-24 00:25 jju_iipg 阅读(179) 评论(0) 推荐(0)
摘要:今天新提交了一次数据,总量达到10337个,本以为成绩会突飞猛进,没想到还是不如从前 但是已经找到人工鼠标轨迹的程序,有待完善,接下来兵分四路:找特征、决策树、完善人工轨迹程序,使其可以将生成的数据自动储存、还一个是Python面向对象。 为什么要学习Python面向对象,因为我发现现在接触的程序越 阅读全文
posted @ 2017-06-22 22:48 jju_iipg 阅读(185) 评论(0) 推荐(0)
摘要:暑假已至,接下来组内成员将会各回各家,各找各妈,这肯定是对本次大数据比赛是很不利的。 接下来我会把任务分配给组员,当然任务会比起初的时候轻一点,因为我认为本次比赛的目的并不是我要求组员做什么,而是我的组员要求自己做什么! 我们现在主要接触的两门语言: MATLAB语言在数据处理方面很牛,它的画图功能 阅读全文
posted @ 2017-06-20 23:35 jju_iipg 阅读(398) 评论(0) 推荐(0)
摘要:目前已经找出26条特征 ,但是提交数据越来越少,给我的感觉是随机森林画的范围越来越小,输出的机器数据也越来越少,我自认为特征没太大问题 我已经将不懂之处列了出来,将于明天咨询大师级人物 阅读全文
posted @ 2017-06-03 23:37 jju_iipg 阅读(151) 评论(0) 推荐(0)
摘要:经过头脑风暴法想出了很多特征,目前经过筛选已经提交了两次数据,数据提交结果不尽如人意,但是收获很大。 接下来继续提取特征,特征数达到27时筛选出20条特征,并找出最佳搭配 阅读全文
posted @ 2017-06-02 23:21 jju_iipg 阅读(170) 评论(0) 推荐(0)
摘要:前几天备战考试,接下来的日子将会继续攻克大数据比赛 虽然停止了一段时间没有提交数据,但是这几天的收获还是有的,对Python 随机森林了解的更了解了 随机森林是由多课决策树组成(当然这个虽然我们初学者都知道,但是我确定没有现在认识的深刻),多棵决策树经过数据训练后,经过投票方式对测试数据进行判断 那 阅读全文
posted @ 2017-06-01 22:15 jju_iipg 阅读(208) 评论(0) 推荐(0)