2020年6月27日

(四)数据清洗主要工作

摘要: 一. 数据清洗主要工作 • 噪声(Noise)消除 • 噪声包含错误值(类别型字段)及离群值(数值型字段) • 噪声使探勘结果有相当大的偏差,必须将噪声移除或将其做适当的处理 2. 空值(Missing Value)填补 • 人工填补• 自动填补 二.噪声如何处理 噪声侦测方法 • 针对类别型字段, 阅读全文

posted @ 2020-06-27 18:33 为主而活 阅读(1881) 评论(0) 推荐(0) 编辑

(三)数据预处理过程简介

摘要: 一、数据预处理过程包括 (一)Attribute Selection(字段选择) Data Integration(数据整合) 多重数据源的整合问题 • 消除数据不一致 台币 VS. 美金• 消除数据重复性 A及B数据表都有某会员的数据 (二)Data Cleansing(数据清洗) Wrong V 阅读全文

posted @ 2020-06-27 18:07 为主而活 阅读(949) 评论(0) 推荐(0) 编辑

(二)数据挖掘需要哪些技术

摘要: 1. 数据挖掘需要哪些基本的技术 统计学知识和技术(Statistical Techniques) 可视化的画图展示技术(Visualization Tchniques):比如可以利用相关软件来画出柱状图、散点图等等 一些常用的数据挖掘技术. KNN K紧邻算法 常用数据挖掘建模技术 2.常用数据挖 阅读全文

posted @ 2020-06-27 17:15 为主而活 阅读(548) 评论(0) 推荐(0) 编辑

(一) 什么是数据挖掘?

摘要: 1.数据挖掘(Data Mining)(KDD:Knowledge Discovery in DataBase 知识发现 ) • William Frawley & Gregory Piatetsky Shapiro, 1991。 • 从现有的大量数据中,撷取不明显、之前未知、可能有用的知识。 2. 阅读全文

posted @ 2020-06-27 16:42 为主而活 阅读(692) 评论(0) 推荐(0) 编辑

导航