《机器学习系统设计》学习笔记(1)
机器学习的目标:通过若干实例让机器学会完成任务。
统计学是机器学习专家经常研究的一个领域。
机器学习的方法不是瀑布式的过程,需要反复分析,探索,尝试。
Python被作者认为是一种非常有效的建模语言。
一个观点:算法不是最花时间的,花时间的是:
1.读取和清洗数据。
2.探索和理解输入数据。
3.分析如何最好的将数据呈现给学习算法。
4.选择正确的模型和学习算法。
5.正确的评估性能。
观点:需要一些统计知识。
观点:数据和算法同样至关重要。
------------------------------------------ -------
推荐了一些网站帮助解答困难:
http://metaoptimize.com/qa
http://www.TwoToReal.com
---------------------------------------------------
需要安装的软件 NumPy, SciPy, matplotlib
经过尝试都可以通过pip来直接安装(我是mac)
NumPy的教程:http://wiki.scipy.org/Tentative_NumPy_Tutorial
需要了解Scipy工具箱里边包含的一些工具如何使用。
----------------------------------------------------------------------
http://www.kaggle.com/ The home of Data Science
http://www.ituring.com.cn/book/1192 示例代码下载网站