read_excel()
1 主要是sheet_name的用法,不要少读了表.
dirct = '../data/INSPEC_train/' # sheet_name 参数有两类四种情况 # 第一类 list或None,返回一个字典,values都是Dataframe # 为list时,指定读取哪些表,字典的key是数字0,1,2等 # 为None的时候返回所有的表,字典的key是表名,可以用a.keys()输出. # 第二类 int或string,返回Dataframe # header 指定作为列名的行,默认0,即取第一行.数据不含列名时,设置为None. a = pd.read_excel( dirct + 'Vp9AaLm_jQU91ppQU0S.xlsx', sheet_name='Process_Table') # a = pd.read_excel( dirct + 'Vp9AaLm_jQU91ppQU0S.xlsx', sheet_name=[0,1,2]) print(type(a)) print(a.keys()) print(a)
2 合并表格
dirct = '../data/INSPEC_train' dirList = [] fileList = [] files = os.listdir(dirct) dataProcess_Table=[] dataPhase_Table=[] dataParameters_Table=[] for i in tqdm(files): dirfile=dirct+"/"+i df_raw = pd.read_excel(dirfile, sheet_name='Process_Table') # 将每个Dataframe放入list后,存储 dataProcess_Table.append(df_raw) df_raw = pd.read_excel(dirfile, sheet_name='Phase_Table') dataPhase_Table.append(df_raw) df_raw = pd.read_excel(dirfile, sheet_name='Parameters_Table') dataParameters_Table.append(df_raw) dataProcess_Table=pd.concat(dataProcess_Table) dataPhase_Table=pd.concat(dataPhase_Table) dataParameters_Table=pd.concat(dataParameters_Table) dataProcess_Table.to_csv('../data/dataProcess_Table.csv', index=False) dataPhase_Table.to_csv('../data/dataPhase_Table.csv', index=False) dataParameters_Table.to_csv('../data/dataParameters_Table.csv', index=False)
ttt