接着学习数据的缺失与补充。
首先对Description字段的缺失值进行填补,填补列选择Description,因为我们这里看不到具体是什么商品缺少描述,所以,填补策略选择指定值,填补值用unknown进行填充。缺失占比很少时可以用平均数中位数进行填补,连续数值型可以用平均数中位数填补,无序离散型可以用众数进行填补。
Description
指定值
unknown