• 博客园logo
  • 会员
  • 周边
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
白粥送榨菜
博客园 首页 新随笔 联系 订阅 订阅 管理

12 2019 档案

 
风控(二):GBDT+LR完成特征非线性组合及建模
摘要:1.背景 LR属于线性模型,容易并行化,可以轻松处理上亿条数据,但是学习能力十分有限,需要大量的特征工程来增加模型的学习能力。但大量的特征工程耗时耗力同时并不一定会带来效果提升。因此,如何自动发现有效的特征、特征组合,弥补人工经验不足,缩短LR特征实验周期,是亟需解决的问题。一般通过笛卡尔积进行两两 阅读全文
posted @ 2019-12-24 21:24 白粥送榨菜 阅读(1298) 评论(0) 推荐(0)
风控(一):ROC曲线和K-S曲线比较及python实现
摘要:1.混淆矩阵(一级指标) 以分类模型中最简单的二分类为例,对于这种问题,我们的模型最终需要判断样本的结果是0还是1,或者说是positive还是negative。我们通过样本的采集,能够直接知道真实情况下,哪些数据结果是positive,哪些结果是negative。同时,我们通过用样本数据跑出分类型 阅读全文
posted @ 2019-12-24 20:54 白粥送榨菜 阅读(4031) 评论(0) 推荐(0)
 

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3