Python--学习笔记4 常用库 <利用Python进行数据分析>

numpy

  科学计算包:多维数组对象;数学运算函数;随机数;傅里叶变换

  可以作为算法之间传递数据的容器。

pandas

  快速处理结构化数据和函数。

  dataframe, 面向列的二维表结构,含有行标和列标。

os

import os
import os.path as op
import os.system as ost

#os库是Python标准库,包含几百个函数,常用路径操作、进程管理、环境参数等几类。os.path子库以path为入口,用于操作和处理文件路径。

# 路径操作:os.path子库,处理文件路径及信息
# 进程管理:启动系统中其他程序
# 环境参数:获得系统软硬件信息等环境参数
os.getcwd()                      # 返回程序的当前路径

os.chdir() 方法用于改变当前工作目录到指定的路径。

matplotliba

  绘制图表的库。

scipy

  解决科学计算中各种标准问题域的包的集合。积分微分方程求解器,矩阵分解,信号处理,稀疏矩阵,标准离散和连续概率分布。numpy和scipy的有机结合可以代替MATLAB中的计算功能。

 


import numpy as np

import pandas as pd

import matplotlib.pyplot as plt


python 的索引从0开始。

path = 'E:/pydata/datasets/bitly_usagov/example.txt' 可以读取

path = 'E:\pydata\datasets\bitly_usagov\example.txt'  无法读取

因此在路径选择是用‘/’


 pandas.read_table(),读取文件数据时,由于分隔符为'::',弹出如下警告:ParserWarning

       解决方法:增加函数的引擎参数engine='python',如下:

df =  pd.read_table('E://pydata/datasets/movielens/users.dat',sep = '::',header=None,names = unames,engine='python')

 

posted on 2018-12-20 17:48  椰汁黑糯米  阅读(224)  评论(0编辑  收藏  举报

导航