Python数据科学 Day1
数据科学域5个常用的Python库
Numpy/Scipy/Pandas/Matplotlib/Scikit-learn
Numpy
- N维数组(矩阵),快速高效,矢量数学运算
- 高效的index,不需要循环
- 开源,底层使用C语言写的,运行效率高
Scipy
- 依赖于Numpy
- 专为科学和工程设计
- 实现了多种常用的科学计算:线性代数,傅里叶变换,信号和图像处理
Pandas
- 结构化数据分析利器(依赖于Numpy)
- 提供了多种高级数据结构:Time-Series,DataFrame,Panel
- 强大的数据索引和处理能力
Matplotlib
- Python 2D绘图领域使用最广泛的套件
- 基本能取代Matlab的绘图功能(散点,曲线,柱形等)
- 通过mplot3d可以绘制精美的3D图
Scikit-learn
- 机器学习的Python模块
- 建立在Scipy之上,提供了常用的机器学习算法:聚类,回归
- 简单易学的API接口