读书笔记《数据挖掘概念与技术》第2章 数据预处理 2.7 小结
摘要:
《数据挖掘:概念与技术(原书第2版)》2.7 小结l数据预处理对于数据仓库和数据挖掘都是一个重要的问题,因为现实中的数据多半是不完整的、有噪声和不一致的。数据预处理包括数据清理、数据集成、数据变换和数据规约。l描述性数据汇总为数据预处理提供分析基础。数据汇总的基本统计学度量包括度量数据集中趋势的均值、加权平均、中位数和众数,度量数据离散程度的极差、四分位数、四分位数间距、方差和标准差。图形表示,如... 阅读全文
posted @ 2008-08-09 02:06 itolssy 阅读(614) 评论(0) 推荐(0) 编辑