摘要: Spark与Kudu的集成同事提供了kudu RDD 阅读全文
posted @ 2018-01-03 21:54 niutao 阅读(375) 评论(0) 推荐(0) 编辑
摘要: kudu之所以执行非常快速,可以用来替代HDFS和Hbase等,一个主要原因是,我们可以将普通SQL中的谓词推入kudu引擎,这样kudu查询数据会变的非常快; 将谓词评估推入Kudu引擎可以提高性能,因为它可以减少需要流回Spark引擎以进行进一步评估和处理的数据量。 通过Spark API当前支 阅读全文
posted @ 2018-01-03 21:51 niutao 阅读(1015) 评论(0) 推荐(1) 编辑