《BuildingMachineLearningSystemsWithPython》学习笔记

BuildingMachineLearningSystemsWithPython

Python机器学习入门

数据分析五个步骤

  1. 读取和清洗数据
  2. 探索和理解输入数据[我的理解是业务理解]
  3. 分析如何将算法应用在算法中
  4. 选择最优的模型和算法
  5. 评估性能

社区资源

  • 最好的资源的kaggle blog
  • metaoptomize、stats.stackexchange.com

start

  • numpy高度优化的多维数组库
    • numpy只有调用copy方法才会复制一个副本,其他时候都在原数据上修改
    • 数组元素的循环处理一定要用高度优化的numpy或scipy拓展函数
    • numpy 的命名空间全都可以通过scipy访问
  • scipy快速的数值分析库
  • matplotlib是绘图最好的库
posted @ 2016-04-15 23:54  cutd  阅读(559)  评论(0编辑  收藏  举报