Pandas DataFrame的基本属性
DataFrame的基础功能,以后要查询就得看这里!
功能清单
df2.index
df2.columns
df2.axes
df2.T
df2.info()
df2.head(i)
df2.tail(i)
df2.describe()
首先随机创建一个DataFrame
# 利用 numpy 的随机函数建立一个 DataFrame df = DataFrame(np.random.rand(50,5))
运行结果
是5行50列的一个二维数组
5行50列的二维数组
这里为了加深印象,我添加了一个字典,增加对比,如下
data = {'state':['Ohino','Ohino','Ohino','Nevada','Nevada'], 'year':[2000,2001,2002,2001,2002], 'pop':[1.5,1.7,3.6,2.4,2.9]} dic_df = DataFrame(data,index=['one','two','three','four','five'], columns=['year','state','pop','debt']) print(df)
运行结果
重点来了,以后查的时候就用下边
df.index
求行
df.index
dic_df.index
df运行结果
RangeIndex(start=0, stop=50, step=1) #意思是从0开始,50结束,步长为1
dic_df的运行结果
Index(['one', 'two', 'three', 'four', 'five'], dtype='object')
df.columns
求列
print(df.columns) print(dic_df.columns)
运行结果
df.axes
print(df.axes) print(dic_df.axes)
运行结果
就是返回两个“边”。
df.T
index 跟 columns 对调
print(dic_df) print(dic_df.T)
运行结果
df.info()
打印二维数组的信息
print(df.info()) print('\n') print(dic_df.info()
运行结果
这里显示的信息都是以列为单位(columns)
df.head(i)
显示前头几行数据,以行为单位,index
print(df.head(4)) print('\n') print(dic_df.head(2))
运行结果
df.tail(i)
从后头显示几条信息
print(df.tail(4)) print('\n') print(dic_df.tail(1))
运行结果
df.describe()
查看数据值列的汇总统计
可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数等相关信息
print(dic_df.describe().T) print('\n') print(dic_df.describe())
运行结果