padas操作
1、从excel读取数据
pd.read_excel('naifen.xlsx')
2、保存为excel
pd.to_excel('bb.xlsx')
3、统计某一列重复数据
df.groupby(['地址'],as_index=False)['地址'].agg({'cnt':'count'}) ,这里统计的是地址列
4、统计某一列中小于某个数的数据
df[df.price<100] ,这里是统计price小于100的数据
5、对某一列求和
df[df.price<100]['price'].sum() , 这里是对price小于100的数据中对price求和
6、去重
drop_duplicates(subset=['A','B','C','D'],keep='first') ,sunset表示列
当keep=False时,就是去掉所有的重复行
当keep=‘first'时,就是保留第一次出现的重复行
当keep='last'时就是保留最后一次出现的重复行
7、查看最后5行数据
dataframe.tail(5)
8、查看有数据类型
dataframe.dtypes
9、统计空值数量
dataframe.isnull().sum()
中文乱码
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False