摘要: 本文代码均已在 MATLAB R2019b 测试通过,如有错误,欢迎指正。 一、分箱平滑的原理 (1)分箱方法 在分箱前,一定要先排序数据,再将它们分到等深(等宽)的箱中。 常见的有两种分箱方法:等深分箱和等宽分箱。 等深分箱:按记录数进行分箱,每箱具有相同的记录数,每箱的记录数称为箱的权重,也称箱 阅读全文
posted @ 2020-10-30 14:18 nefu-ljw 阅读(5021) 评论(0) 推荐(0) 编辑
摘要: 本文代码均已在 MATLAB R2019b 测试通过,如有错误,欢迎指正。 一、数据规范化的原理 数据规范化处理是数据挖掘的一项基础工作。不同的属性变量往往具有不同的取值范围,数值间的差别可能很大,不进行处理可能会影响到数据分析的结果。为了消除指标之间由于取值范围带来的差异,需要进行标准化处理。将数 阅读全文
posted @ 2020-10-30 13:54 nefu-ljw 阅读(5499) 评论(0) 推荐(1) 编辑