摘要: 对于标称型数据,在特征处理的时候,需要对其进行编码 在编码之前,如果训练集和测试集是分开的,则需要对其进行合并,避免标称数据丢失 # 合并 df = train.append(test).reset_index() # 列名 original_columns = list(df.columns) 常 阅读全文
posted @ 2016-09-26 23:36 tonglin0325 阅读(768) 评论(0) 推荐(0) 编辑