会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
肉松松鼠
博客园
首页
新随笔
联系
订阅
管理
2018年10月21日
连续特征离散化
摘要: 1. Entropy-Based Discretization 基于熵的离散化 用熵对连续数据进行离散化,其基本思想是利用熵的大小来表示划分后数据集的纯度,熵越小,数据纯度越大,得到的离散数据可用性就更高 具体做法是:先把数据集划分为两部分,计算两部分的熵的和,在熵最小的地方划分,然后对熵最大的那部
阅读全文
posted @ 2018-10-21 16:53 肉松松鼠
阅读(976)
评论(0)
推荐(0)
编辑
公告