摘要: 一 数值类型 原因:数值类型可能跨度过大,跨几个数量级,不符合模型的前提条件。拟合出来的模型不够强壮。 1 二值化 2 处理长尾分布数量,有两种思路,一种是对数处理,一种是分箱处理。处理的原因还是因为横跨了若干个数量级,对很多模型都是问题。 3 归一化,处理设计欧式距离的算法,比如KNN,K-mea 阅读全文
posted @ 2020-07-01 19:34 骑者赶路 阅读(283) 评论(0) 推荐(0) 编辑