《BuildingMachineLearningSystemsWithPython》学习笔记
BuildingMachineLearningSystemsWithPython
Python机器学习入门
数据分析五个步骤
- 读取和清洗数据
- 探索和理解输入数据[我的理解是业务理解]
- 分析如何将算法应用在算法中
- 选择最优的模型和算法
- 评估性能
社区资源
- 最好的资源的kaggle blog
- metaoptomize、stats.stackexchange.com
start
- numpy高度优化的多维数组库
- numpy只有调用copy方法才会复制一个副本,其他时候都在原数据上修改
- 数组元素的循环处理一定要用高度优化的numpy或scipy拓展函数
- numpy 的命名空间全都可以通过scipy访问
- scipy快速的数值分析库
- matplotlib是绘图最好的库