摘要:
数据预处理 1.为什么数据预处理 2.数据为什么脏 3.为什么数据预处理是重要的 4.数据质量 5.数据预处理的主要任务 6.数据预处理的形式 数据清理 1.如何处理缺失数据 2.如何处理噪音数据 数据集成 1.模式集成、冲突数据值、冗余数据 数据变换 规范化数据的方法 :最小-最大规范化、Z-sc 阅读全文
摘要:
1.数据从何而来 2.数据对象和属性类型 数据集合的类型 结构数据的重要特征 数据对象 属性 属性类型 数据属性的类型 离散 vs.连续属性 3.数据的(基本)统计描述 分布度量 代数度量 整体度量 度量数据的中心趋势 对称/偏斜数据 4.数据可视化 5.数据的相似性和相异性、邻近度 数据矩阵和相异 阅读全文