[学习笔记] [数据分析] 01.Python入门

1、安装Python与环境配置

② 安装pip以及利用pip安装Python库

 

 

2、Anaconda安装

 

conda list 要在root环境下

3、常用数据分析库

① Numpy

安装:conda install numpy (conda在Anaconda上安装,pip则是在本地上安装)

提供常用的数值、数组、矩阵函数。

基于“向量化”的运算,进行数值运算时比list高。

② Scipy

安装:conda install scipy

是一种使用NumPy来做高等数学、信号处理、优化、统计的扩展包

③ Pandas

安装:conda install pandas

也是基于Numpy的扩展包,支持CSV文件输入,整合时间序列,进行数据处理。

重要的数据结构:Series 和 DataFrame

具体操作:

显示整个表格所有行:head(),展示表格第一行:head(1)

展示表格的一些属性:

表格转秩:

对表格中某列进行排序:

④ Matplotlib

安装:conda install matplotlib

seaborn库

 

四、常用高级数据分析库

①nltk (Natural Language Toolkit)

pip install -U nltk

import nltk

下载预料库:nltk.download()

应用:文本提取、词汇切分、词频分析、词袋模型、情感分析

 

②igraph

研究社交网络的数据和图计算

pip install -U python-igraph

conda install -c marufr python-igraph=0.7.1.post6

 

③ scikit-learn

机器学习模型的训练 

是建立在scipy之上的一个用于机器学习的Python模块

pip install -U scikit-learn

conda install scikit-learn

 

五、Python2和Python3的区别

Python3的语言更加规范些

W3School Python 教程

 

posted @ 2017-06-02 22:31  Jayson_Guan  阅读(240)  评论(0编辑  收藏  举报