pandas 处理 excel

先写下来,以免后续忘记,有很多都是之前用过的,

依旧忘!!! 嘤嘤嘤

 

data_file = pandas.read_excel('/imporExcel/2017_7_7.xlsx',sep = '\t',encoding = 'utf-8',sheetname='产品表',index=None)

# 给data_file 添加 数列作为index,以方便定位单元格
list = []
for i in range(0,1240):
    list.append(i)
data_file.index = list

 

 

用0 或者 --  或者任意你喜欢的东东替换掉nan,这个float类型的nan真的是好讨厌

# 将所有的nan 替换成'--',inplace=True 是实际更改了data_file,
# 如果不加inplace,则只是当时更改而已
data_file.fillna('--',inplace = True)

 

直接去掉nan

# 加了unique,去掉很多NaN
print(data_file['T2'].unique())

 

也可以写成  data_file.loc[2:12,'T2']

#将第五行 带 columns,转成列的样式打印出来 ,by position
print(data_file.iloc[5])

# 将第五列带index打出来,by label
print(data_file.loc[:,'T2'])

 

 

# 打印出index
print(data_file.index)

#打印出columns 
print(data_file.columns)

# df的宽和列
print(data_file.shape)

# 列的所有名字列出
print(data_file.columns.values)

 

 

 

# axis = 1  列
# axis = 0  行
# inplace = True 实际应用到文件上

data_file.drop(co,axis = 1, inplace= True)

 

posted @ 2017-07-26 14:24  vivi~  阅读(276)  评论(0编辑  收藏  举报