利用PYTHON进行数据分析 学习笔记

Python for Data Analysis 这本书是唐学韬老师带领的团队在2013年就翻译完毕的著作。原书作者是美国的McKinney.W.。现在是2019年,Python的使用如火如荼,我不知道它是否已经发展成熟。Just do it.现在开始。。。也不晚

Python 给人的初次印象非常的好,工整、语法逻辑清晰,可以说非常类似于英语的自然语法了(我是说和一段标准的英文对话很类似了)。

作为一个初学者,我最最对Python感到崇拜的,就是它的LIST 和 for...in...:迭代循环,仔细想想其实我们的工作方式和思考方式就是这么个样子,把工作内容或思想排列成清单,然后一项项地处理。。。一项项地处理。。。,在迭代中,做出各种判断、给出其后的结果、或是论断。那本著名的《Head First Python》中开篇就告诉大伙——人人都爱LIST

 

本书中所说的“数据”,主要指的是结构化数据(structured data),比如:

  • 多维数组(矩阵)
  • 表格型数据
  • 通过关键列(对于SQL用户而言,就是主键和外键)相互联系的多个表
  • 间隔平均或不平均的时间序列
 

为什么要使用Python进行数据分析

我以前读一本教程时,最常做的事情之一就是忽略文章中的“为什么。。。”章节,我以为我既然看这本书,就是知道“为什么”,现在我明白,原来我是那么的“错”,看教程一定要仔细研读其中的“为什么。。。”;以前,我常做的另一件错事,就是基本不看书的“目录”,如果你也有这种习惯,让我们一起改正吧。

  • Python适合巨量的数据处理
  • Python适合复杂的数据分析
  • WEB框架(Django)
  • 活跃的科学计算社区
  • 丰富的“库”资源
  • Python是计算机语言“粘合剂”

完全可以只使用Python一种语言来构建以数据为中心的应用程序。通俗地说,Python最适合于统计学、探索性需求。作为一个科学计算平台,Python成功地集成C、C++、Fortran代码。

 

重要的Python库

利用Python进行数据分析,根本就是在和各种库在打交道,下面是最最常用的:

  • NumPy
  • Pandas
  • matplotlib
  • SciPy
 

安装和设置

为了数据处理而使用Python,就让我们在64base操作系统环境下,安装一个Anaconda(64-bit)环境吧,一路“next”,几乎不会出错。然后,所有其他需要安装的库,就“pip install module_name”,非常好使啊。

这一篇应该就是踏入数据分析的开始吧。我会坚持继续学习,也会继续修改上面这些文字,当我学得更深时,我也许会把上面的文字改的面目全非。

posted @ 2019-05-13 22:31  学到老•徐  阅读(159)  评论(0编辑  收藏  举报