数据分析常用库及开发环境部署

常用库简介

1.Numpy

  Numpy是Numerical Python的简写,主要可以用来做Python数值计算。它提供了多种数据结构、算法以及大部分涉及Python数值计算所需的接口。

  具有以下优点:

    ①快速、高效的多维数组对象ndarray

    ②基于元素的数组计算以及直接对数组执行数学运算的函数

    ③用于读写硬盘上基于数组的数据集的工具

    ④线性代数运算、傅里叶变换,以及随机数生成

    ⑤用于将C、C++、Fortran代码集成到python的工具

2.Pandas

  Pandas使我们进行数据分析的一个主要工具。它所包含的数据结构和数据处理工具的设计使得Python中进行数据清洗和分析非常快捷。pandas一般也是和其他数值计算工具一起使用的,支持大部分Numpy语言风格的数组计算。

  pandas和numpy最大的区别就是pandas是用来处理表格型或者异质性数据的,而Numpy则刚好相反,它更适合处理同质型的数值类数组数据

3.matplotlib

  matplotlib是最流行的用于绘制数据图表的python库。

4.Scipy

  Scipy是科学计算领域针对不同标准问题域的包集合。提供了强大的科学计算方法(矩阵分析、信号分析、数理分析等)

5.IPython和Juypyter notebook

  IPython是一个加强版的Python解释器,Juypyter notebook是一种基于Web的代码笔记本,最初也是源于IPython项目。

  ipython安装:pip install ipython

开发环境部署

1.Anacoda介绍

  Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等多个科学包及其依赖项,与电脑上已安装pycharm不冲突。

Anaconda解决了官方Python的两大痛点:

(1)提供了包管理功能,Windows平台安装第三方包经常失败的场景得以解决。

(2)提供环境管理功能,解决了多版本Python并存、切换的问题。

2.下载

  Anaconda下载网址:https://www.anaconda.com/distribution/#download-section

3.配置环境变量

  如果是Windows环境的话就需要在 控制面板\系统和安全\系统\高级系统设置\环境变量\用户变量\PATH 当中添加anaconda的安装目录的Scripts文件夹。

  验证:打开命令行输入 conda --version,如果能输出版本号就表示环境变量配置成功。

 4.运行Anaconda

打开安装的Anaconda文件。

点击Anaconda Navigator运行,便进入到主页面。

5.Jupyter里创建项目

 

 

posted @ 2019-12-02 17:27  kuanglinfeng  阅读(351)  评论(0编辑  收藏  举报