《机器学习系统设计》学习笔记(1)

机器学习的目标:通过若干实例让机器学会完成任务。

统计学是机器学习专家经常研究的一个领域。

机器学习的方法不是瀑布式的过程,需要反复分析,探索,尝试。

Python被作者认为是一种非常有效的建模语言。

一个观点:算法不是最花时间的,花时间的是:

1.读取和清洗数据。

2.探索和理解输入数据。

3.分析如何最好的将数据呈现给学习算法。

4.选择正确的模型和学习算法。

5.正确的评估性能。

 

观点:需要一些统计知识。

观点:数据和算法同样至关重要。

------------------------------------------ -------

推荐了一些网站帮助解答困难:

http://metaoptimize.com/qa

http://www.TwoToReal.com

---------------------------------------------------

需要安装的软件 NumPy, SciPy, matplotlib

经过尝试都可以通过pip来直接安装(我是mac)

NumPy的教程:http://wiki.scipy.org/Tentative_NumPy_Tutorial

需要了解Scipy工具箱里边包含的一些工具如何使用。

----------------------------------------------------------------------

 

http://www.kaggle.com/   The home of Data Science

http://www.ituring.com.cn/book/1192 示例代码下载网站

 

posted @ 2014-09-02 23:02  skytraveler  阅读(462)  评论(0编辑  收藏  举报