Python--学习笔记4 常用库 <利用Python进行数据分析>
numpy
科学计算包:多维数组对象;数学运算函数;随机数;傅里叶变换
可以作为算法之间传递数据的容器。
pandas
快速处理结构化数据和函数。
dataframe, 面向列的二维表结构,含有行标和列标。
os
import os import os.path as op import os.system as ost #os库是Python标准库,包含几百个函数,常用路径操作、进程管理、环境参数等几类。os.path子库以path为入口,用于操作和处理文件路径。 # 路径操作:os.path子库,处理文件路径及信息 # 进程管理:启动系统中其他程序 # 环境参数:获得系统软硬件信息等环境参数
os.getcwd() # 返回程序的当前路径
os.chdir() 方法用于改变当前工作目录到指定的路径。
matplotliba
绘制图表的库。
scipy
解决科学计算中各种标准问题域的包的集合。积分微分方程求解器,矩阵分解,信号处理,稀疏矩阵,标准离散和连续概率分布。numpy和scipy的有机结合可以代替MATLAB中的计算功能。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
python 的索引从0开始。
path = 'E:/pydata/datasets/bitly_usagov/example.txt' 可以读取
path = 'E:\pydata\datasets\bitly_usagov\example.txt' 无法读取
因此在路径选择是用‘/’
pandas.read_table(),读取文件数据时,由于分隔符为'::',弹出如下警告:ParserWarning
解决方法:增加函数的引擎参数engine='python',如下:
df = pd.read_table('E://pydata/datasets/movielens/users.dat',sep = '::',header=None,names = unames,engine='python')