摘要: Kudu 是 Cloudera 开源的新型列式存储系统,是 Apache Hadoop 生态圈的新成员之一( incubating ),专门为了对快速变化的数据进行快速的分析,填补了以往 Hadoop 存储层的空缺。本文主要对 Kudu 的动机、背景,以及架构进行简单介绍。 背景——功能上的空白 H 阅读全文
posted @ 2017-03-06 09:40 XGogo 阅读(2680) 评论(0) 推荐(1) 编辑
摘要: After the GA of Apache Kudu in Cloudera CDH 5.10, we take a look at the Apache Spark on Kudu integration, share code snippets, and explain how to get 阅读全文
posted @ 2017-03-06 09:35 XGogo 阅读(2387) 评论(0) 推荐(0) 编辑