pandas之DataFrame
一、添加数据
1.创建数据框Object Creation
import pandas as pd import numpy as np dates=pd.date_range('2020-03-08',periods=7) dF1=pd.DataFrame(np.random.rand(7,4),index=dates)
2.整合数据
Concat/Merge/Append
Concat:将数据框拼接在一起(可按rows或columns)
Merge:类似于SQL中Join的用法
Append:将数据按rows拼接到数据框中
3.数据导入和导出
Csv和Excel
二、数据查看及操作
1.查看
head():查看数据前几项,看数据长什么样
info():查看数据类型,以及数据缺失情况
descibe():查看数据描述统计性信息,数据大概分布情况
dF1.head()
dF1.info()
dF1.describe()
2.选取
#主要操作 dF1['属性名'] dF1[0:3] dF1.loc[0] dF1.iloc[1] dF1.iloc[1:3,[0,3]] dF1[dF1['属性名']>30] dF1[dF1['A'].isin(['B'])] dF1[dF1['A'].isin(['B'])&(dF1['C']>5)]
3.分组
dF1.groupby('属性名')
4.删除行或列
#axis代表选中的是行还是列,列是1,行是2。inplace代表有没有真正删除 dF1.drop('A',axis = 1,inplace = True)