pandas 处理 excel
先写下来,以免后续忘记,有很多都是之前用过的,
依旧忘!!! 嘤嘤嘤
data_file = pandas.read_excel('/imporExcel/2017_7_7.xlsx',sep = '\t',encoding = 'utf-8',sheetname='产品表',index=None) # 给data_file 添加 数列作为index,以方便定位单元格 list = [] for i in range(0,1240): list.append(i) data_file.index = list
用0 或者 -- 或者任意你喜欢的东东替换掉nan,这个float类型的nan真的是好讨厌
# 将所有的nan 替换成'--',inplace=True 是实际更改了data_file, # 如果不加inplace,则只是当时更改而已 data_file.fillna('--',inplace = True)
直接去掉nan
# 加了unique,去掉很多NaN print(data_file['T2'].unique())
也可以写成 data_file.loc[2:12,'T2']
#将第五行 带 columns,转成列的样式打印出来 ,by position print(data_file.iloc[5]) # 将第五列带index打出来,by label print(data_file.loc[:,'T2'])
# 打印出index print(data_file.index) #打印出columns print(data_file.columns) # df的宽和列 print(data_file.shape) # 列的所有名字列出 print(data_file.columns.values)
# axis = 1 列 # axis = 0 行 # inplace = True 实际应用到文件上 data_file.drop(co,axis = 1, inplace= True)