padas操作

1、从excel读取数据

　　pd.read_excel('naifen.xlsx')

2、保存为excel

　　pd.to_excel('bb.xlsx')

3、统计某一列重复数据

　　df.groupby(['地址'],as_index=False)['地址'].agg({'cnt':'count'}) ，这里统计的是地址列

4、统计某一列中小于某个数的数据

　　df[df.price<100] ，这里是统计price小于100的数据

5、对某一列求和

　　df[df.price<100]['price'].sum() ，这里是对price小于100的数据中对price求和

6、去重

　　drop_duplicates(subset=['A','B','C','D'],keep='first') ，sunset表示列

　　当keep=False时，就是去掉所有的重复行

　　当keep=‘first'时，就是保留第一次出现的重复行

　　当keep='last'时就是保留最后一次出现的重复行

7、查看最后5行数据

　　dataframe.tail(5)

8、查看有数据类型

　　dataframe.dtypes

9、统计空值数量

　　dataframe.isnull().sum()

中文乱码

plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False

posted @ 2018-09-29 16:55 Lin-纸短情长阅读(888) 评论(0) 编辑收藏举报

刷新页面返回顶部

Lin-纸短情长，道不尽太多涟漪