摘要: 现在我们已经用wxpython制作一个gui程序,目前它只能用于筛选有用的特征组。我们知道好的特征是非常重要,但有用的特征组是同等重要,这个工具可以使我们更加迅速的筛选有用的特征组合,大大节约我们的时间,而且操作起来非常简单。 这个工具的缺点是:从几十个特征中筛选出十个特征速度为最优,如果特征数增加 阅读全文
posted @ 2017-06-27 21:26 jju_iipg 阅读(217) 评论(0) 推荐(0) 编辑
摘要: 首先需要设计一个用户图形界面的函数,这个图形界面被用于在其上面绘制轨迹并记录当时的坐标。 该回响函数应包含:鼠标按下时,鼠标移动时,和鼠标释放时的反应命令。当然网上有有相关的开源 程序,但是有缺陷(该程序只能记录当时的点的坐标,无法记录整个轨迹坐标,更不用说同时记录多条轨迹)。 这时,这用在func 阅读全文
posted @ 2017-06-25 13:21 jju_iipg 阅读(1395) 评论(0) 推荐(0) 编辑
摘要: 在我们比赛的算法中,我们使用了交叉验证方法来筛选比较重要的特征,现在我们来了解一下什么是交叉验证(Cross-Validation):有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析, 而其它子集则用来做后续对此分析的确认及验证。 一开始的子集被称为 阅读全文
posted @ 2017-06-24 19:26 jju_iipg 阅读(307) 评论(0) 推荐(0) 编辑
摘要: 经过一个下午找资料,已作出人工轨迹记录程序,这样就可以增加样本容量 接下来三个方向:特征、决策树、机械轨迹程序 虽然机械轨迹的程序相对好做,但是现有机械轨迹程序太过于死板,不能自行更改轨迹 阅读全文
posted @ 2017-06-24 00:25 jju_iipg 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 今天新提交了一次数据,总量达到10337个,本以为成绩会突飞猛进,没想到还是不如从前 但是已经找到人工鼠标轨迹的程序,有待完善,接下来兵分四路:找特征、决策树、完善人工轨迹程序,使其可以将生成的数据自动储存、还一个是Python面向对象。 为什么要学习Python面向对象,因为我发现现在接触的程序越 阅读全文
posted @ 2017-06-22 22:48 jju_iipg 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 暑假已至,接下来组内成员将会各回各家,各找各妈,这肯定是对本次大数据比赛是很不利的。 接下来我会把任务分配给组员,当然任务会比起初的时候轻一点,因为我认为本次比赛的目的并不是我要求组员做什么,而是我的组员要求自己做什么! 我们现在主要接触的两门语言: MATLAB语言在数据处理方面很牛,它的画图功能 阅读全文
posted @ 2017-06-20 23:35 jju_iipg 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 目前已经找出26条特征 ,但是提交数据越来越少,给我的感觉是随机森林画的范围越来越小,输出的机器数据也越来越少,我自认为特征没太大问题 我已经将不懂之处列了出来,将于明天咨询大师级人物 阅读全文
posted @ 2017-06-03 23:37 jju_iipg 阅读(140) 评论(0) 推荐(0) 编辑
摘要: 经过头脑风暴法想出了很多特征,目前经过筛选已经提交了两次数据,数据提交结果不尽如人意,但是收获很大。 接下来继续提取特征,特征数达到27时筛选出20条特征,并找出最佳搭配 阅读全文
posted @ 2017-06-02 23:21 jju_iipg 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 前几天备战考试,接下来的日子将会继续攻克大数据比赛 虽然停止了一段时间没有提交数据,但是这几天的收获还是有的,对Python 随机森林了解的更了解了 随机森林是由多课决策树组成(当然这个虽然我们初学者都知道,但是我确定没有现在认识的深刻),多棵决策树经过数据训练后,经过投票方式对测试数据进行判断 那 阅读全文
posted @ 2017-06-01 22:15 jju_iipg 阅读(195) 评论(0) 推荐(0) 编辑
摘要: 今天使用了所有特征并且用SVM测试数据 理由:SVM可以使用特征将测试集划分区域,比较单调、死板 结果:成绩很不理想,无疑又一次说明随机森林更适合大数据处理第二次提交数据 用MATLAB运行11次运算结果,提取其中6次及6次以上重复出现的数据,提交结果:分数降低5分本次目的:检测以往数据的准确率总结 阅读全文
posted @ 2017-05-30 22:51 jju_iipg 阅读(243) 评论(0) 推荐(0) 编辑