摘要:
Impala的安装后配置 本节介绍Impala的强制和推荐配置设置。如果使用群集管理软件安装Impala,其中一些配置可能会自动完成;您仍然必须手动配置短路读取。如果您想自定义环境,请考虑进行本主题中描述的更改。 无论Impala是否安装了群集管理软件,您都必须启用短路读取。此设置在 Impala 阅读全文
摘要:
安装Impala Impala是一个针对Apache Hadoop的开源分析数据库,可以快速返回查询响应。 按照以下步骤,通过从源码构建在集群上设置Impala。 下载最新版本。请参阅Impala下载页面以获取最新版本的链接。 检查 README.md 文件,以获得指向构建说明的指针。 请检查MD5 阅读全文
摘要:
Impala方案设计指南 本主题中的指南可以帮助你构建一个优化的、可扩展的模式,这个模式可以与你现有的数据管理流程很好地集成。在进行任何概念验证工作、移植工作或部署到生产中之前,请将这些准则作为检查表。 如果您正在改编现有数据库或 Hive 模式以用于 Impala,请阅读本节中的指导原则,然后参阅 阅读全文
摘要:
Impala要求 为了达到预期的性能,Impala取决于以下各节所述的软件、硬件和配置的可用性。 支持的操作系统 Apache Impala仅在Linux系统上运行。更多信息请参见 README.md 文件。 Hive Metastore和相关配置 Impala可以与存储在Hive中的数据互操作,并 阅读全文
摘要:
Impala部署规划 在生产中设置Impala之前,先做一些规划,以确保你的硬件设置有足够的容量,你的集群拓扑是Impala查询的最佳选择,你的模式设计和ETL流程遵循Impala的最佳实践。 Impala官网翻译07-Impala要求 Impala官网翻译08-Impala方案设计指南 阅读全文
摘要:
Impala如何融入Hadoop生态系统? Impala 利用了 Hadoop 生态系统中许多熟悉的组件。Impala可以作为消费者和生产者与其他Hadoop组件进行数据交换,因此它可以以灵活的方式适应您的ETL和ELT管道。 Impala如何与Hive合作 Impala的一个主要目标是使SQL-o 阅读全文
摘要:
开发Impala应用程序 Impala的核心开发语言是SQL。您也可以使用 Java 或其他语言通过许多商业智能工具使用的标准 JDBC 和 ODBC 接口与 Impala 进行交互。对于特殊类型的分析,您可以通过用C++或Java编写用户定义函数(UDF)来补充SQL内置函数。 Impala SQ 阅读全文
摘要:
Impala服务器的组件 Impala服务器是一个分布式的大规模并行处理(MPP)数据库引擎。它由不同的守护进程组成,这些进程在集群内的特定主机上运行。 Impala后台 Impala的核心组件是Impala守护进程,物理上由impalad进程表示。Impala 守护进程执行的几个主要功能是。 读取 阅读全文
摘要:
Impala的概念和架构 以下各节提供了背景信息,以帮助您使用 Impala 及其功能提高工作效率。在适当的地方,解释包括上下文,以帮助理解Impala的各个方面与您可能已经熟悉的其他技术(如关系数据库管理系统和数据仓库)或其他Hadoop组件(如Hive、HDFS和HBase)的关系。 Impal 阅读全文
摘要:
介绍Apache Impala Impala直接对存储在HDFS、HBase或亚马逊简单存储服务(S3)中的Apache Hadoop数据提供快速、交互式的SQL查询。除了使用相同的统一存储平台,Impala还使用与Apache Hive相同的元数据、SQL语法(Hive SQL)、ODBC驱动程序 阅读全文