Python中pandas模块的使用方法
import pandas as pd
Python中pandas模块的讲解
Python运用于数据分析的简单教程: http://www.jb51.net/article/62982.htm
read_csv()
读写csv数据
df = pd.read_csv(path): 读入csv文件,形成一个数据框(data.frame)
df = pd.read_csv(path, header=None) 不要把第一行作为header
to_csv()
* 注意,默认会将第一行作为header,并且默认会添加index,所以不需要的话需要手动禁用 *
df.to_csv(path, header=False, index=False)
数据框操作
df.head(1) 读取头几条数据
df.tail(1) 读取后几条数据
df[‘date’] 获取数据框的date列
df.head(1)[‘date’] 获取第一行的date列
df.head(1)[‘date’][0] 获取第一行的date列的元素值
sum(df[‘ability’]) 计算整个列的和
df[df[‘date’] == ‘20161111’] 获取符合这个条件的行
df[df[‘date’] == ‘20161111’].index[0] 获取符合这个条件的行的行索引的值
df.iloc[1] 获取第二行
df.iloc[1][‘test2’] 获取第二行的test2值
10 mins to pandas
df.index 获取行的索引
df.index[0] 获取第一个行索引
df.index[-1] 获取最后一个行索引,只是获取索引值
df.columns 获取列标签
df[0:2] 获取第1到第2行,从0开始,不包含末端
df.loc[1] 获取第二行
df.loc[:,’test1’] 获取test1的那一列,这个冒号的意思是所有行,逗号表示行与列的区分
df.loc[:,[‘test1’,’test2’]] 获取test1列和test2列的数据
df.loc[1,[‘test1’,’test2’]] 获取第二行的test1和test2列的数据
df.at[1,’test1’] 表示取第二行,test1列的数据,和上面的方法类似
df.iloc[0] 获取第一行
df.iloc[0:2,0:2] 获取前两行前两列的数据
df.iloc[[1,2,4],[0,2]] 获取第1,2,4行中的0,2列的数据
(df[2] > 1).any() 对于Series应用any()方法来判断是否有符合条件的
原文:https://blog.csdn.net/Mrzhangjwei/article/details/53509040