关于特征离散的方法
from sklearn.preprocessing import OneHotEncoder
首先,假设
性别:female;male
地域:北京;上海;深圳
那么可以优化成
性别男 性别女 地域北京 地域上海 地域深圳 共5列
那么:
男性北京:[1,0,1,0,0]
女性上海:[0,1,0,1,0]