2018 年 1月 3 日随笔档案 - niutao

2018年1月3日

摘要： Spark与Kudu的集成同事提供了kudu RDD 阅读全文

posted @ 2018-01-03 21:54 niutao 阅读(375) 评论(0) 推荐(0) 编辑

摘要： kudu之所以执行非常快速，可以用来替代HDFS和Hbase等，一个主要原因是，我们可以将普通SQL中的谓词推入kudu引擎，这样kudu查询数据会变的非常快；将谓词评估推入Kudu引擎可以提高性能，因为它可以减少需要流回Spark引擎以进行进一步评估和处理的数据量。通过Spark API当前支阅读全文

posted @ 2018-01-03 21:51 niutao 阅读(1015) 评论(0) 推荐(1) 编辑