记一次带逗号的数字类型处理
这个整型在西文中, 就是欧洲人的表示方法中 要使用 , 区分3位数字. 所以在int中会有逗号。
1 import pandas
2 pd=pandas.read_csv(r'D:\data\test01.csv') 3 print(pd.info()) 4 print(pd.head(10))
可以看出area字段类型是object,现在我们的需求,就是将这个数据类型转换成int类型。
自定义转换函数:
import numpy as np
def convert_int(str_0): str_1=str_0.replace(',','') return np.int(str_1)
首先自定义函数,将字段中的逗号替换掉,然后转成int
print(pd['area'].apply(convert_int).head(3))
也可以在读取数据时进行数据类型转换,一步到位
pd=pandas.read_csv(r'D:\data\test01.csv',converters={'ID':str,'area':convert_int,'Scence':int})
我站在远处,就这样看着,一句话也不说。