[学习笔记] [数据分析] 01.Python入门
1、安装Python与环境配置
①
② 安装pip以及利用pip安装Python库
2、Anaconda安装
conda list 要在root环境下
3、常用数据分析库
① Numpy
安装:conda install numpy (conda在Anaconda上安装,pip则是在本地上安装)
提供常用的数值、数组、矩阵函数。
基于“向量化”的运算,进行数值运算时比list高。
② Scipy
安装:conda install scipy
是一种使用NumPy来做高等数学、信号处理、优化、统计的扩展包
③ Pandas
安装:conda install pandas
也是基于Numpy的扩展包,支持CSV文件输入,整合时间序列,进行数据处理。
重要的数据结构:Series 和 DataFrame
具体操作:
显示整个表格所有行:head(),展示表格第一行:head(1)
展示表格的一些属性:
表格转秩:
对表格中某列进行排序:
④ Matplotlib
安装:conda install matplotlib
seaborn库
四、常用高级数据分析库
①nltk (Natural Language Toolkit)
pip install -U nltk
import nltk
下载预料库:nltk.download()
应用:文本提取、词汇切分、词频分析、词袋模型、情感分析
②igraph
研究社交网络的数据和图计算
pip install -U python-igraph
conda install -c marufr python-igraph=0.7.1.post6
③ scikit-learn
机器学习模型的训练
是建立在scipy之上的一个用于机器学习的Python模块
pip install -U scikit-learn
conda install scikit-learn
五、Python2和Python3的区别
Python3的语言更加规范些
W3School Python 教程