会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
何大卫的博客
Computer Science
博客园
首页
新随笔
联系
订阅
管理
2018年11月30日
sklearn连续型数据离散化
摘要: 二值化 设置一个condition,把连续型的数据分类两类。比如Age,大于30,和小于30。 这是x中 30的设置为1,其他的设置为0. 标签 有时数据可能需要对数据进行分箱化处理,或者给不同的数据设置不同的标签。 可以在l对象,用classes_属性,查看总共有多少类。 label中就是处理过的
阅读全文
posted @ 2018-11-30 13:38 何大卫
阅读(2321)
评论(0)
推荐(0)
编辑
公告