机械狗的机器学习入门(绪)——做一盘大菜。2019/3/31

从今天开启机器学习的大门,我是一名机械专业(车辆工程)的学生,我不想从事制造业,所以尝试进入IT行业的大门,从写博客入手来考验自己,评测自己是否具备互联网从业者所学的自学能力以及意志力。

 

一、我对互联网行业以及机器学习领域的认识

      最开始接触到互联网【技术】是在大一的时候,因为对电子设计、机器人等的爱好而加入了社团,开始接触单片机的编程,逐渐对编程产生了兴趣,然后逐渐后悔自己选择了机械专业。后来开始不限于c语言的学习,开始认识一些面向对象的语言,花了一个月多的零零碎碎的时间学了python,用蹩脚和下三滥的编程思维写了例如【邮件远程控制pc关机和pc开机邮件提醒】【基于百度翻译API的批量翻译】这么些个小程序。程序功能实现的那一刻带来的成就感不是画一张油泵装配图带来的感觉所能比拟的,于是开始萌生了当程序员的想法。互联网的发展有目共睹,近十年来网络带给人们生活的影响有目共睹,并以传统制造业无法赶超的速度发展。早几年出现Alpha Go,现在的海量数据分析(有时候虽然是流氓行为),以及5G技术使得万物互联的实现,互联网正在以铺天盖地之势席卷全球。未来,小到一粒沙子,只要愿意,那么它就可以联网。

  在我的专业课程学习中,零零碎碎也会接触这些技术,例如智能制造,德国的工业4.0等,这让我看到了曙光。不知道在哪看过一句话:你所学的专业不应该成为你的负担,而应该是成为你的积累。 我为什么要被不景气的制造业束缚呢,技多不压身的道理在哪都适用,我在思考机器学习技术和制造业之间的联系。其实机器学习有很多可用的地方,例如金属疲劳的测定,机械故障的检修与预测,可以说,只要有数据的地方,都可以运用机器学习。打个比方:我们知道修车是一个比较依赖于经验的技术活,往往老师傅能够一眼看穿故障所在,针针见血,精准排除故障;再例如,我们专业课老师说的,在我们国家总有一两个大神,他们能够根据机车(火车头)运行返回的数据异常判断出机车的故障,这种人具备相当扎实的专业技能,他们的薪资也是非常高的。在上述两个例子当中,往往离不开【经验】和【数据】,那么这两个词恰恰就是机器学习所能够干的事情。经验丰富的修车师傅身体不行了,难免会有所疏漏;大神再厉害,全国也就那么几个,再者如果每台机车都配一个年薪百万的大神,那么老百姓就坐不起火车了。那么如果我们将这些所谓的【经验】和实时的【数据】利用起来,运用机器学习的方法来达到与老师傅和大神同样甚至超越的效果,那还不是何乐而不为呢。所以,在我看来,机器学习是运用【数据】学习得到【经验】,并运用【经验】来做出【决策】的存在。

 

二、我的机器学习路径

        要明确学习路径,就要知道机器学习的整个流程是什么。我购买的书籍是 Alexander T.Combs所著的 Python Machine Learning Blueprints  。之后的学习我会在这本书的基础上展开学习。根据这本书所述,我将要点展开。

   1、获取

      【数据】作为机器学习的最重要一部分,它是我们的研究对象,那么获取对象就是机器学习的开端。获取数据的方式有很多,在互联网领域常用的是Web爬虫:通过程序来自动获取指定网站上的内容;还有的是从服务器上直接获取数据,这通常是自己已经拥有了这些数据,直接对这些数据进行学习和分析即可;还有些数据不是单纯的数字,他们可以是图像甚至是视频。我们这里把数据的获取用一个非常好理解的词来标记:【买菜】

    2、检查和检索

       当你获取了一大堆【数据】之后,要对数据进行初步的分析来确保你所要分析的数据是切实有效的,它们是否符合一些基本的常识,例如是否为正数,或者是对于身高数据大于2.5 m 这种情况肯定是不合逻辑的,我们要做的就是让所有获取的数据都是真实有效的,这一点很重要。我们这里把检查和检索用一个非常好理解的词来标记:【洗菜】

    3、清理和准备

     在获取了数据,同时数据真实有效的前提下,我们就可以对数据进行处理了,我们要找到数据分析合适的格式。在获取数据时我们也说了,数据有很多中不同的来源和不同的形式,数字分析与图像分析他们俩之间的数据肯定是不同的,我们不会用同一种方法来分析数字与图像。所以我们要通过手段让这些数据变得“方便食用”,我们又用一个形象的词来描述这个过程:【切菜】  

  4、建模

     经过上面三个步骤,我们就对【数据】处理完毕了,现在我们获得了真实有效的,可以用来分析的数据。接下来就涉及到【经验】的部分了,也就是建模的部分。我们要使用合适的算法来根据这些数据训练出模型。在训练模型的过程中,我们把算法称之为【菜谱】,我们按照自己的口味需要和食材的不同来选择不同的菜谱,这个步骤我们可以称它为【下锅】

  5、评估

      我们有了训练出来的模型,这个模型也就是我所说的【经验】,那么这个训练出来的模型到底符不符合我们的要求呢?这个时候你就需要【试菜】,我们让这个模型尝试预测一些东西,评估它的有效性。

  6、部署

     当你觉得训练出来的模型符合我们的要求,也就是你做的菜符合你的口味时,我们就可以把菜端出去让别人瞧一瞧了,你可以放在web上,也可以放在任何你想让别人看到的地方来炫耀你做的菜有多么的好吃。这叫【上菜】

 

我如此生动形象的描述了机器学习的整个流程,那么我也将以同样生动形象的方式去学习。厨子的基本功是什么?洗菜、更重要的切菜,然后再慢慢的开始学炒菜。

 

 

如果你碰巧看到了这篇博客,并你也跟我一样,欢迎交流。

 

posted @ 2019-03-31 14:24  yqhmz  阅读(571)  评论(1编辑  收藏  举报