Pandas DataFrame的基本属性

DataFrame的基础功能,以后要查询就得看这里!

功能清单

df2.index
df2.columns
df2.axes
df2.T
df2.info()
df2.head(i)
df2.tail(i)
df2.describe()

 

首先随机创建一个DataFrame

# 利用 numpy 的随机函数建立一个 DataFrame
df = DataFrame(np.random.rand(50,5))

运行结果

是5行50列的一个二维数组

5行50列的二维数组

 这里为了加深印象,我添加了一个字典,增加对比,如下

data = {'state':['Ohino','Ohino','Ohino','Nevada','Nevada'],
        'year':[2000,2001,2002,2001,2002],
        'pop':[1.5,1.7,3.6,2.4,2.9]}
dic_df = DataFrame(data,index=['one','two','three','four','five'],
               columns=['year','state','pop','debt'])
print(df)

运行结果

 

 重点来了,以后查的时候就用下边

df.index 

求行

df.index
dic_df.index

df运行结果

RangeIndex(start=0, stop=50, step=1)
#意思是从0开始,50结束,步长为1

 dic_df的运行结果

Index(['one', 'two', 'three', 'four', 'five'], dtype='object')

df.columns
求列
print(df.columns)
print(dic_df.columns)

运行结果

 

 df.axes

print(df.axes)
print(dic_df.axes)

运行结果

就是返回两个“边”。

 

df.T

index 跟 columns 对调

 

print(dic_df)
print(dic_df.T)

运行结果

 

df.info()
打印二维数组的信息
print(df.info())
print('\n')
print(dic_df.info()

运行结果

这里显示的信息都是以列为单位(columns)

df.head(i)
显示前头几行数据,以行为单位,index
print(df.head(4))
print('\n')
print(dic_df.head(2))

 运行结果

 

df.tail(i)

从后头显示几条信息

print(df.tail(4))
print('\n')
print(dic_df.tail(1))

运行结果

df.describe()

查看数据值列的汇总统计

可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数等相关信息

print(dic_df.describe().T)
print('\n')
print(dic_df.describe())

运行结果

 

posted @ 2018-06-05 18:06  人无远虑  阅读(6709)  评论(0编辑  收藏  举报