数据清洗记录——.图书馆学号去敏

图书馆学号去敏,末尾数字随机改变为字母。

import random
import numpy
import pandas as pd
datas=pd.read_excel(r"C:\Users\Oscar\Desktop\datas.xlsx")
t=[]
def pp():
    s="abcdefghijklmnopqrstuvwxyz"
    l=list(s)
    while len(t)<10:
        sui=numpy.random.randint(len(l)-1)
        chulai=l.pop(sui)
        t.append(chulai)
    return t

def process(s):
    if isinstance(s,int):
        last_num=int(str(s)[-1])
        qianbian=str(s)[:-1]
        new_last_num=t[last_num]
        return qianbian+str(new_last_num)
    else:
        last_num=int(s[-1])
        qianbian=s[:-1]
        new_last_num=t[last_num]
        return qianbian+str(new_last_num)

pp()
datas["新学号"]=datas["学号"].apply(process)
new_data=datas.drop(["学号"],axis=1)
new_data.to_csv("E:\\new_data.csv")

 

posted @ 2017-03-24 23:43  coskaka  阅读(258)  评论(0编辑  收藏  举报