会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wangfan000
新随笔
联系
订阅
管理
随笔 - 8
文章 - 2
评论 - 0
阅读 -
3123
随笔分类 -
03 机器学习
特征分箱
摘要:一、类别型特征 1)类别数在5个以下,可以直接根据类别来分箱 (binning_cate) 2)类别数在5个以上,建议做降基处理,再根据降基后的类别做分箱 def binning_cate(df, col, target): """ df:数据集 col:输入的特征 target:好坏标记的字段名
阅读全文
posted @
2022-01-23 23:00
wangfan000
阅读(371)
评论(0)
推荐(0)
编辑
公告
昵称:
wangfan000
园龄:
4年6个月
粉丝:
0
关注:
2
+加关注
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
最新随笔
1.Hive函数大全
2.大数据之元数据
3.kettle
4.macOS使用docker搭建hadoop集群
5.特征分箱
6.mysql基础知识笔记
7.mongdb笔记
8.python 正则学习笔记
我的标签
python基础
(1)
积分与排名
积分 - 3123
排名 - 218780
随笔分类
00 环境相关(1)
01 python基础(1)
03 机器学习(1)
04 Hadoop生态(3)
05 数据库(2)
随笔档案
2023年5月(2)
2023年2月(1)
2022年11月(1)
2022年1月(1)
2021年9月(3)
文章档案
2022年10月(2)
阅读排行榜
1. 大数据之元数据(824)
2. Hive函数大全(802)
3. macOS使用docker搭建hadoop集群(575)
4. 特征分箱(371)
5. kettle(152)
点击右上角即可分享