2014年工作总结
即将农历新年了,意味着传统意义上的2014年也就要成为历史了,这里总结一下2014年工作生活吧:
一、工作方面:
- 2014年是穿戴式医疗设备概念萌芽的一年,也是医疗设备行业、医疗服务行业快速发展的一年吧。信息技术迅速发展,并把触角伸向了极为保守、传统的医疗行业,也带给了普通人就业、发展的机会,2014年初,个人也从传统的IT(芯片制造)进入了医疗设备、服务行业,从制造业数据分析的角色转变为一名算法工程师。
- 完成两个项目的算法研发工作,主要围绕信号检测、模式识别应用于一些新型医疗设备,也算是对自己的一次不小的挑战吧,毕竟是第一次独立应对项目研发。
- 学了会C#,主要是项目需要了,学的半路子货色,就不多说什么了。
- 发表了一篇水货论文,作为本科生进入科研领域,在一块确实还有很多需要补足的。
- 工作内容和其他算法工程师、数据挖掘工程师类似了,主要是提取数据、建模、模型验证、交付给业务方再次验证、模型修正等等,当然,如果对数据足够喜爱的话,这过程也是自得其乐啦。
- 工作其中也会读到很多大牛的文章,对自身的算法工作提供了很多思路。
二、生活学习:
- 读了几本书,觉得都还不错,一起共享一下了
- 首先是吴军老师的系列作品,之前读过他的“数学之美”,能把数据原理描述的如此简洁,实属不易,之后把“浪潮之巅(上下册)”、“文明之光”都看了,前者是讲述百年IT历史的,后者讲述近代科学史的。
- 科学遇见未来类作品:世界是平的、第二次机器革命,这两本书前后著书时间相差7年,世界是平的为2007初版发行,时隔7载,书中讲述的全球化、供应链整合等内容均已经悄悄发生进入我们的生活,第二次机器革命主要讲述机器智能化、高度自动化对生活、就业等方方面面可能产生的影响,作为一个ITer,寻找抓住下一个十年,如何应用/应对智能化对我们造成的影响,确实是值得深思的问题。
- 统计学:“女士品茶”,这个更像是讲述统计思想起源的故事,对统计学理论书籍暂时无爱的,不妨一读;当统计理论对算法、数据挖掘真的很重要啊,骨头再硬也忍了。
- 技术类:模式识别、数据挖掘概念与技术,前者是模式识别算法的集大成、并有详细的理论公式推倒、结果分析论证,对算法学习可谓是准确全面,翻译的也不错(主要是俺们英文原版买不起啊,有木有)。后者适合入门,算法基本没有什么推倒过程,着重阐述结果,有数据预处理、异常数据分析两章不错,刚好也是“模式识别”的补充。
- C#高级编程,这个就不说什么了,我是编程水货。
- 网易公开课系列:
- 斯坦福大学“机器学习课程”,吴恩达在斯坦福任教时的公开课。
- 加州理工大学:机器学习与数据挖掘,我觉的这个讲述的更好懂一些。
- 学习摄像,目前还处于摸爬期,都说是搭讪妹子的利器,当然要学学了。
- 工作之于锻炼一下,一刻不能松懈啊,对长期久坐的苦逼上班族更是如此了
三、身为一名算法/数据挖掘工程师的体会:
- 项目前期尽量用简单、熟悉的模型,这样便于尽快熟悉业务、认识问题,按照简洁是美的原则,简单的往往也会收到很好的效果的。当然,语音识别、图像处理领域,更倾向于使用复杂的模型,如最近风靡的深度学习算法,这个和问题的维度、场景复杂度有一定的关联。
- 当手头有大规模的数据时,不妨先抽样成小样本容量试试,几百、几千个样本,这样训练起来时间短、可以更快的看到结果,也更容易促使我们去分析特征、认识数据,充分认识数据对进行数据预处理大有帮助。一个算法工程师很多时间也是耗费在了数据预处理这一步。
- 当有一个Idea时,不妨找点数据再implement一下,勤动手、多做实验,也不失为一个好方法。
- 多和业务部分沟通,理解需求;多和软件部分沟通,了解系统瓶颈,或许有助于提升性能。
就这么多了;专家说要记下来、说出来印象才深刻,谁说不是呢()
At Last,欢迎交流、欢迎指正~