摘要:
在数据预处理的过程当中往往需要将多个数据集合中的数据整合到一个数据仓库中,即:需要对数据库进行集成。与此同时,为了更好地对数据仓库中的数据进行挖掘,对数据仓库中的数据进行变换也在所难免。本文主要针对数据集成以及数据变化两个问题展开论述。数据集成在将多个数据库整合为一个数据库过程中存在需要着重解决三个... 阅读全文
摘要:
数据清洗:数据清洗作为数据预处理中的一个步骤,主要用于处理由于数据仓库中数据不完整、数据噪声以及数据不一致导致的问题。有人可能质疑,为什么要对数据进行清洗?忽略那些出问题的数据不行吗?当然,视而不见确是一种应对策略,但作为数据挖掘中的一环,没有高质量的数据又谈何挖掘的可信性。为此,对于数据数据挖掘来... 阅读全文