2019年4月16日

数据挖掘-数据清理-噪声数据

摘要: 数据清理-噪声数据 数据清理例程试图填充缺失的值、光滑噪声并识别离群点、纠正数据中的不一致。 噪声数据 噪声(noise)是被测量的变量的随机误差或方差。光滑数据,去除噪声方法如下。 1.分箱(binning) 分箱方法通过考察数据的近邻(即周围的值)来光滑有序数据值。这些有序的值被分不到一些桶或箱 阅读全文

posted @ 2019-04-16 22:40 嘣嘣嚓 阅读(1208) 评论(0) 推荐(0) 编辑

数据挖掘-数据清理-缺失值

摘要: 数据清理-缺失值 数据清理例程试图填充缺失的值、光滑噪声并识别离群点、纠正数据中的不一致。 缺失值 在处理数据时,会发现很多元组的一些属性没有记录值。可使用以下方法补充。(1) 忽略元组:当缺少类标号时通常这样做。除非元组有多个属性缺少值,否则该方法不是很有效。当每个属性缺失值的百分比变化很大时,它 阅读全文

posted @ 2019-04-16 22:39 嘣嘣嚓 阅读(702) 评论(0) 推荐(0) 编辑

导航