记一次带逗号的数字类型处理

这个整型在西文中, 就是欧洲人的表示方法中 要使用 , 区分3位数字. 所以在int中会有逗号。

1 import pandas
2 pd=pandas.read_csv(r'D:\data\test01.csv') 3 print(pd.info()) 4 print(pd.head(10))

可以看出area字段类型是object,现在我们的需求,就是将这个数据类型转换成int类型。

自定义转换函数:

import numpy as np
def
convert_int(str_0): str_1=str_0.replace(',','') return np.int(str_1)

首先自定义函数,将字段中的逗号替换掉,然后转成int

print(pd['area'].apply(convert_int).head(3))

也可以在读取数据时进行数据类型转换,一步到位

pd=pandas.read_csv(r'D:\data\test01.csv',converters={'ID':str,'area':convert_int,'Scence':int})

posted on 2019-08-19 19:07  jack_6511  阅读(890)  评论(0编辑  收藏  举报

导航