(一)准备阶段
2019年研究生数学建模比赛,我们组选择的是D题目——《汽车行驶工况构建》。
选题分析
其实题目一发下来后,基本确定了这几个题目的已知条件、难易程度、问题结果要求等等,具体分析画了个思维导图:
-
对于A题目,没有接触过专业训练的同学一般都不会去选,因为这个涉及到AI训练的问题。不知道参加比赛的小伙伴们有没有注意到比赛官网好早就贴出通知,华为云为数学建模比赛提供免费的云平台,所以比赛前我就猜到,一定会有大数据的题目,果不其然!对于前期申请了云平台试用的同学,这是个绝佳的机遇,毕竟万一拿奖了,那就意味着可以去华为工作了把~。
-
对于B题目,没看太懂,直接放弃了。
-
对于C题目,这个题目我很清楚整个建模过程,但是具体怎么用代码实现,不敢去尝试,因为图像处理这些不是一朝一夕就能掌握的!其实题目中的砖块长度告诉了后,就可以根据长度和砖块在像素中的长度,计算得到一个比例尺,这样就可以根据像素求解实际距离了。对于车的车头,应该会有算法能够实现其车头特征的识别和提取,然确定像素位置,两个车头识别出来后,就可以计算像素距离,反求实际距离了。对于后面的问题研究的是速度,其实只需要根据视频的帧数计算每幅图像中特征点的像素移动距离,除以帧数对应的时长就可以计算出速度,进而做下一步研究... 以上就是我对C题目的大致理解了,不太好做,放弃。
-
对于D题目,这个题目倒是十分好理解的,基本上就是处理异常数据,提取运动片段,计算运动特征,找个代表出来,做特征表征,这个题目最有把握做出来,而且只有三个问题。并且我自己就是机械专业的,工况这个概念还是十分熟悉的,就决定是他了!
-
对于E题目,这是个开放性的题目,难在找数据,并且里面应该存在着大量气象学的图像研究,不太好搞,放弃!
-
对于F题目,年年都有无人机,我的预言验证了!题目看似很好理解,但是其实这种航迹规划类的题目,越做越会发现,约束条件不好描述,很容易陷入僵局,细思极恐!果断放弃!(去年就是死在无人机那个题目,这次打死不敢选)。
经过上面的分析,我和师弟确定了难度顺序:
所以,选做D题目是比较有把握的,我们就做D题目!
准备工作
整理题目信息
大概在第一天上午结束的时候,我和师弟决定,就是D题目了。为了保证万无一失,我们先反复研究了题目的内容,其中包括题目的问题背景、问题目标、问题结果。画出了一个思维导图:
在这里面,我们有去研究过国家有关汽车工况实验的国家标准 GBT - 中国汽车行驶工况 第1部分:轻型汽车
文件内容整理
题目给了三个文件,非常有必要对三个文件做个具体分析:
字段理解
这里的三轴加速度传感器困扰了我们很久!怎么会有三个???而且三个文件的大小趋势不一样!这这个字段到底表达的是什么?无从知晓。但是后来一想,其实这个字段没有太大的意义。因为加速度直接根据速度差除以时间就可以得到!另外,这些字段相互之间应该能够通过取一定数字特征表达出当前的汽车状态,比如停车,速度持续为0;油门开度为0表示松开油门;发动机转速的区间会反应当前的工况;空燃比忽大忽小应该是起步和刹车造成的,等等。这些相关性都是数据预处理可以作为评判标准的重要内容,要仔细研究!!
经纬度轨迹还原
我们注意到里面有经纬度的数据,于是想到有没有什么软件可以把连续的经纬度点画成轨迹。
起初本来想利用前端的知识,调用百度地图这样的API来画图,结果前端学的不够扎实,没能实现,这里给出经纬度定位的网站和几个勉强能实现的demo出处:
这个工作持续了一段时间,无果,决定放弃挣扎,看看有没有可以画这种图的软件。找了一会,还真有!
这个软件真的很强大,根据表格导入数据,确定经纬度数据行列,就可以画轨迹。于是我们赶紧画出了三个文件的轨迹:
很明显有异常数据嘛!!经纬度都跑到海上去了,查看才知道,全部是同为0的经纬度。
此外,我们还发现这次数据的采集地点在福建省福州市和莆田市。
文献查找
对研究内容和数据文件内容有了大致的了解后,我们开始各种找文献,找资源。
这里主要用到了这些网站
这个前期文献查找工作大概持续了一两天,因为前两天各种问题都没有得到比较深入的理解,所以作为编程人员的我,迟迟不敢动手。但是作为写作人员的师弟,工作一直没有停下来,能写的都先写了,等我出结果。另外在文献方面,我找的文献大多数都是编程逻辑清晰,流程明确的文献,可能不够档次,但是对问题描述的很清楚,很仔细,适合新手看。而师弟是写作的,他找的文献大部分偏向于理论指导的,所以几乎都是硕博论文这样的完整文献。
总之,文献反复查找了很多,但都没仔细看。
前期准备的一些收获
生死攸关的转折点
大概是第二天晚上的时候,我通过一篇文献,搞清楚了这个课题的来源!
这篇论文简直是整个比赛中生死攸关的转折点!因为这里面的数据和我们一模一样!!
仔细看文章里面的数据出处后,我们确定了数据采集的平台,和相关的课题。并研究了许多与这个课题相关的文献。原来题目是这样来的!!
数据来源
D题目的数据来源是中国汽车技术研究中心(CATC)研发的数据采集系统所采集到的,其实数据是否异常,在系统中都是可以得到提醒的,但是只是部分异常的情况,比如汽车停车、设备断电等等。而对于路况,其他因素造成的,需要自己编程出来。
课题项目
在那篇文献里,我们确定了这个题目来自于国家科研基金项目:
工业和信息化部中国新能源汽车产品检测工况研究和开发资助项目(CATC)
所以只要以这个基金项目去查找文献,基本上都是十分有用的文献,这个真的非常关键。正因为这个重要信息的出现,我在第三天的熬夜工作中,取得了突破性进展,一下子完成了前面两问!
那天熬的夜太值得了,而且我当时思路特别清晰,人十分清醒,我清楚的记得那一天,我只休息了两个小时。
前期工作总结
洋洋洒洒写了前面那么多的东西,虽然不够系统,但是却能够真实反应出我们对一个题目从陌生到熟悉的整个理解过程。还是非常幸运,能够在第三天获得重要的突破,化解了危机。这期间压力十分大,因为此时其他小组已经有出前几问的成果了。那是我整个比赛过程中,最清醒,最兴奋,最有成就感的一天。
下一阶段任务
完成第一问 点击查看