浅谈机器学习方法
一,公开数据集
- UCI数据集是一个常用的标准测试数据集,下载地址UCI数据集
- 在看别人的论文时,一般会给出使用的数据集的出处或下载地址(除非是很机密的数据,例如与国家安全有关)。如果你看的论文没有给出数据集的出处,建议停止看这篇论文,并且停止看刊发这篇论文的期刊上的所有文章。因为可以断定这些论文的质量一定不怎么好。
二,源代码
- 网上有很多公开源码的算法包,例如最为著名的Weka,MLC++等
- Weka下载地址http://www.cs.waikato.ac.nz/ml/weka/,很多的机器学习经典算法都在里面,并且公布源程序,容易修改。
- 如果作者没有公布源代码,可以到作者主页找找,或者写信给作者要,一般论文开头都会有作者的email,写信的时候要注意要很有礼貌,否则作者,尤其是著名学者,很有可能不会理睬。如果算法简单,可以自己实现。
三,论文下载
- 学校电子图书馆
- google学术
- 免费期刊,例如http://www.jmlr.org/,http://www.cs.washington.edu/research/jair/home.html
四,做研究要求
- 数学基础
- 程序设计能力
- 看高质量的论文
作者:奋斗的珞珞
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.