会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
残阳飞雪
博客园
首页
新随笔
联系
订阅
管理
2018年2月1日
spark LinearRegression 预测缺失字段的值
摘要: 最近在做金融科技建模的时候,字段里面很多缺少值得时候,模型对于新用户的预测会出现很大的不稳定,即PSI较大的情况。 虽然我们依据字段IV值得大小不断的在调整字段且开发新变量,但是很多IV值很大的字段直接用平均值、或者0代替显然不够合理。 所以,我们在尝试把字段缺失值当作需要预测的值,把该字段不缺失的
阅读全文
posted @ 2018-02-01 10:06 残阳飞雪
阅读(921)
评论(0)
推荐(0)
编辑
公告