padas操作

1、从excel读取数据

  pd.read_excel('naifen.xlsx')

2、保存为excel

  pd.to_excel('bb.xlsx')

3、统计某一列重复数据

  df.groupby(['地址'],as_index=False)['地址'].agg({'cnt':'count'})  ,这里统计的是地址列

4、统计某一列中小于某个数的数据

  df[df.price<100]  ,这里是统计price小于100的数据

5、对某一列求和

  df[df.price<100]['price'].sum() , 这里是对price小于100的数据中对price求和

6、去重

  drop_duplicates(subset=['A','B','C','D'],keep='first')   ,sunset表示列

  当keep=False时,就是去掉所有的重复行

  当keep=‘first'时,就是保留第一次出现的重复行

  当keep='last'时就是保留最后一次出现的重复行

7、查看最后5行数据

  dataframe.tail(5)

8、查看有数据类型

  dataframe.dtypes

9、统计空值数量

  dataframe.isnull().sum()

中文乱码

  

plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False

posted @ 2018-09-29 16:55  Lin-纸短情长  阅读(888)  评论(0编辑  收藏  举报