读入不规范成绩(多列并在一个单元格中)并生成规范的成绩
例子:
方法:
pandas 读入txt文档,按照空格分隔,然后删除空列,用str替换掉得分:,最后生成新的excel文档
import pandas as pd path = '政治.txt' df = pd.read_csv( path, sep=' ', header=None ) df.drop(range(1,3),axis=1) #删除空数据的列的数据 df[3]=df[3].str.replace('得分:','').astype('int32') del df[1] #删除列1 del df[2] df.to_excel('政治1.xlsx')
最好是直接删除列:
import pandas as pd path = '政治.txt' df = pd.read_csv( path, sep=' ', header=None ) #df.drop(range(1,3),axis=1) del df[1] del df[2] df[3]=df[3].str.replace('得分:','').astype('int32')#这里列索引还是3 df.to_excel('政治1.xlsx')
效果: