摘要: 数据集成就是将多个数据源合并存放在一个数据存储中(如数据仓库),从而方便后续的数据挖掘工作 大数据项目中 80% 的工作都和数据集成有关,这里的数据集成有更广泛的意义,包括了数据清洗、数据抽取、数据集成和数据变换等操作 这是因为数据挖掘前,我们需要的数据往往分布在不同的数据源中,需要考虑字段表达是否 阅读全文
posted @ 2020-04-25 10:30 怡情养性长智 阅读(405) 评论(0) 推荐(0) 编辑