Kudu-Impala集成特性

　　不多说，直接上干货！

Kudu-Impala 集成特性

　　CREATE / ALTER / DROP TABLE

　　Impala 支持使用 Kudu 作为持久层来 creating（创建），altering（修改）和 dropping（删除）表。这些表遵循与 Impala 中其他表格相同的 Internal / external（内部 / 外部）方法，允许灵活的数据采集和查询。

　　INSERT

　　数据可以使用与那些使用 HDFS 或 HBase 持久性的任何其他 Impala 表相同的语法插入 Impala 中的 Kudu 表。

　　UPDATE / DELETE

　　Impala 支持 UPDATE 和 DELETE SQL 命令逐行或批处理修改 Kudu 表中的已有的数据。选择 SQL 命令的语法与现有标准尽可能兼容。除了简单 DELETE 或 UPDATE 命令之外，还可以 FROM 在子查询中指定带有子句的复杂连接。

　　Flexible Partitioning（灵活分区）

　　与 Hive 中的表分区类似，Kudu 允许您通过 hash 或范围动态预分割成预定义数量的 tablets，以便在集群中均匀分布写入和查询。您可以通过任意数量的 primary key（主键）列，任意数量的 hashes 和可选的 list of split rows 来进行分区。参见模式设计。

　　Parallel Scan（并行扫描）

　　为了在现代硬件上实现最高的性能，Impala 使用的 Kudu 客户端可以跨多个 tablets 扫描。

　　High-efficiency queries（高效查询）

　　在可能的情况下，Impala 将谓词评估下推到 Kudu，以便使谓词评估为尽可能接近数据。在许多任务中，查询性能与 Parquet 相当。

　　有关使用 Impala 查询存储在 Kudu 中的数据的更多详细信息，请参阅 Impala 文档。

欢迎大家，加入我的微信公众号：大数据躺过的坑人工智能躺过的坑 Java从入门到架构师

同时，大家可以关注我的个人博客：

http://www.cnblogs.com/zlslch/ 和 http://www.cnblogs.com/lchzls/ http://www.cnblogs.com/sunnyDream/

详情请见：http://www.cnblogs.com/zlslch/p/7473861.html

　　人生苦短，我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神，汇聚于互联网和个人学习工作的精华干货知识，一切来于互联网，反馈回互联网。
　　目前研究领域：大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。语言涉及：Java、Scala、Python、Shell、Linux等。同时还涉及平常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。只要你一直关注和呆在群里，每天必须有收获

对应本平台的讨论和答疑QQ群：大数据和人工智能躺过的坑（总群）（161156071）

posted @ 2017-09-28 16:53 大数据和AI躺过的坑阅读(2935) 评论(0) 收藏举报

刷新页面返回顶部

大数据和人工智能躺过的坑

Kudu-Impala集成特性

Kudu-Impala 集成特性

公告