摘要: Apache Spark™是用于大规模数据处理的统一分析引擎。 从右侧最后一条新闻看,Spark也用于AI人工智能 spark是一个实现快速通用的集群计算平台。它是由加州大学伯克利分校AMP实验室 开发的通用内存并行计算框架,用来构建大型的、低延迟的数据分析应用程序。它扩展了广泛使用的MapRedu 阅读全文
posted @ 2019-02-19 18:30 醉城、 阅读(1450) 评论(0) 推荐(0) 编辑
摘要: 元数据管理包括业务词汇表的发展,数据元素和实体的定义,业务规则和算法以及数据特征。最基础的管理是管理业务元数据的收集、组织和维持。对技术型元数据的应用对主数据管理和数据治理项目的成功至关重要。 元数据是“所有系统、文档和流程中包含的所有数据的语境。是生数据的知识。”换句话说,如果没有元数据,组织IT 阅读全文
posted @ 2019-02-19 11:54 醉城、 阅读(382) 评论(0) 推荐(0) 编辑