会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
骑着赶路
博客园
首页
新随笔
联系
订阅
管理
2020年7月1日
精通特征工程
摘要: 一 数值类型 原因:数值类型可能跨度过大,跨几个数量级,不符合模型的前提条件。拟合出来的模型不够强壮。 1 二值化 2 处理长尾分布数量,有两种思路,一种是对数处理,一种是分箱处理。处理的原因还是因为横跨了若干个数量级,对很多模型都是问题。 3 归一化,处理设计欧式距离的算法,比如KNN,K-mea
阅读全文
posted @ 2020-07-01 19:34 骑者赶路
阅读(285)
评论(0)
推荐(0)
编辑
公告