02 2018 档案

决策树-过程
摘要:1. 决策树的基本概念 我们这里介绍一下一个比较简单的机器学习系统 决策树. 它的概念最容易理解, 因为人类的许多决策实际上就是一个决策树. 通常使用的分类回归树(class and regress tree)是一个二叉树。它的形式一般为: 每个方框代表一个节点. 每个非叶子节点有2个分支, 一个是 阅读全文

posted @ 2018-02-27 14:01 残阳飞雪 阅读(8099) 评论(0) 推荐(0) 编辑

spark LinearRegression 预测缺失字段的值
摘要:最近在做金融科技建模的时候,字段里面很多缺少值得时候,模型对于新用户的预测会出现很大的不稳定,即PSI较大的情况。 虽然我们依据字段IV值得大小不断的在调整字段且开发新变量,但是很多IV值很大的字段直接用平均值、或者0代替显然不够合理。 所以,我们在尝试把字段缺失值当作需要预测的值,把该字段不缺失的 阅读全文

posted @ 2018-02-01 10:06 残阳飞雪 阅读(924) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示