读入不规范成绩(多列并在一个单元格中)并生成规范的成绩

例子:

 

 方法:

pandas 读入txt文档,按照空格分隔,然后删除空列,用str替换掉得分:,最后生成新的excel文档

import pandas as pd
path = '政治.txt'
df = pd.read_csv(
    path,
    sep=' ',
    header=None
           )
df.drop(range(1,3),axis=1)  #删除空数据的列的数据
df[3]=df[3].str.replace('得分:','').astype('int32')
del df[1] #删除列1
del df[2]
df.to_excel('政治1.xlsx')

最好是直接删除列:

import pandas as pd
path = '政治.txt'
df = pd.read_csv(
    path,
    sep=' ',
    header=None
           )
#df.drop(range(1,3),axis=1)
del df[1]
del df[2]
df[3]=df[3].str.replace('得分:','').astype('int32')#这里列索引还是3
df.to_excel('政治1.xlsx')

 

效果:

 

posted @ 2022-12-24 04:38  scholar-for-ever  阅读(17)  评论(0编辑  收藏  举报