Victoria's workshop

导航

【转】机器学习的练习方法

转自:程序员初学机器学习的四种方式

http://blog.jobbole.com/67621/

 

小型项目方法论

以上四个策略属于我称为“小型项目”的方法论。你用这个方法可以很快建立在技术领域(比如机器学习)方面的实用技能。大意就是你设计并且亲手完成解决特定问题的小项目。

小型项目在几个方面应该足够小,才能保证你能完成它们并且从中学习,然后好步入到下一个项目中去。下面是一些你应该考虑加在项目上的一些限制:

  • 时间短:一个项目从头到最后能有可展现的结果不应超过5-15小时。这样利用一周中不上班的晚上和周末时间你就能完成一个小项目。
  • 范围小:一个项目应该有意义,但同时应该是你感兴趣的问题的范围最小的版本。举个例子,与其解决广义的“写一个能告诉我微博是否会被转发的程序”,还不如去研究这个问题在一个特定的账号在一个特定的时间段内的表现。
  • 所需资源少:一个项目应该能用你的可联网的台式或者笔记本电脑完成。你不应该需要奇葩的软件,网络架构,或者第三方数据或者服务。你应搜集需要的数据,读入内存,用开源工具来解决你那个小问题。

额外有关项目的小贴士

这些策略的原则是让你利用你的程序员技能开始行动。下面是三条帮助你调整思维模式,有助你开始行动的小贴士:

  • 写下你学到的东西。我推荐你每个步骤都产生一个有形的劳动成果。它可以是本子里的笔记,微博,博客文章或者是开源项目。每个劳动成果都可以作为一个里程碑或锚。
  • 除非项目的目的是写代码,否则不要写。这条不是那么显而易见,但却是最能帮助你加快理解机器学习的速度的建议。
  • 目的是学到东西,而不是产生独一无二的资源。不要管是否有人读你关于一个算法的研究、教程或是笔记。这些都是你的观点,是你的劳动成果,他们证明你现在掌握到了知识。

总结

下面是这些策略的一句话清晰总结,可以帮助你选择适合自己的那个。

  1. 学习一个机器学习工具:选择一个你喜欢的工具或类库,学习如何很好的使用它。。
  2. 学习一个机器学习数据集:选择一个数据集,深入地离家它,发掘哪类算法处理它最有效。
  3. 学习一个机器学习算法:选择一个算法,深入理解它,发掘什么样的参数设置在不同数据集上都稳定。
  4. 实现一个机器学习算法:选择一个算法,用你选定的语言实现它或者是把已有的实现移植到你选定的语言上。

posted on 2017-04-06 12:41  xiaojin693  阅读(229)  评论(0编辑  收藏  举报