07 2021 档案

摘要:def dig2chars(s): """ 五百一十二 -->512 一三二 --> 132 """ # 使用unicode编码 fl = unicode(str(s).decode('gbk').encode('utf-8'), 'utf-8') # 先把数字提取 part = re.compil 阅读全文
posted @ 2021-07-19 15:15 Young_Mo 阅读(158) 评论(0) 推荐(0) 编辑
摘要:from pandarallel import pandarallel import pandas as pd pandarallel.initialize(nb_workers=4) res = pd.read_csv('./8.csv', low_memory=False) res['SFRZM 阅读全文
posted @ 2021-07-07 17:47 Young_Mo 阅读(677) 评论(0) 推荐(0) 编辑
摘要:# pandas 查出全部的重复的数据 duplicate = res[res.duplicated(subset=[col])][col].tolist() fin_res = res[res[col].isin(duplicate)]# 当使用dupilcated方法查重时 只会查重重复的数据, 阅读全文
posted @ 2021-07-01 15:59 Young_Mo 阅读(32) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示