利于Pandas和scikit-learn将str类型的data转换成int类型数值案例
假设一个data中其某列值是显示工作单位属性的,为了方便算法计算,需要将这些属性转换成数值替换。
通过pd.series.unique()确认工作单位属性的个数
利于pandas方法转换
使作anywhere即可返回到值的索引。
将需要str类型的所有列全部转换
实现批量替换
第二种,利于scikit-learn preprocess转换
也可以使用LabelEncoder,OneHotEncoder
OrdinalEncoder 与上面例题的pandas方法转换是一样的。将str值按其属性值的排序的索引值进行转换。
,OneHotEncoder, 略
LabelEncoder 是需要一列一列转换,也能实现数值转换。使用时需要加for循环
for col in salary.columns:
salary[col]=labelEncoder.fit_transfrom(salary[col])