摘要: 简介 Oozie 是用于 Hadoop 平台的开源的工作流调度引擎。 用于管理 Hadoop 属于web应用程序, 由 Oozie client 和 Oozie Server 两个组件构成。 Oozie Server 运行于 Java Servlet容器 (Tomcat) 中的 web 程序。 作用 阅读全文
posted @ 2019-11-08 20:22 wellDoneGaben 阅读(253) 评论(0) 推荐(0) 编辑
摘要: OLAP (Online analytical processing)[联机分析处理] 1. 起源 数据库概念最初源于1962年Kenneth Iverson发表的名为“A Programming Language” (APL)的著作,它第一次提出了处理操作和多维变量的的数学表达式,后来APL语言由 阅读全文
posted @ 2019-11-08 18:02 wellDoneGaben 阅读(689) 评论(0) 推荐(0) 编辑
摘要: 1. 简介 Cloudera公司推出,提供对HDFS、Hbase数据的高性能、低延迟的交互式SQL查询功能。 基于Hive使用内存计算,兼顾数据仓库、具有实时、批处理、多并发等优点 是CDH平台首选的PB级大数据实时查询分析引擎 2. Impala 优势 基于内存进行计算, 能够对 PB 级数据进行 阅读全文
posted @ 2019-11-08 14:52 wellDoneGaben 阅读(332) 评论(0) 推荐(0) 编辑