摘要:
Impala教程 本节包括教程场景,演示软件安装后如何开始使用Impala。它的重点是加载数据的技术,因为一旦你在表中有了一些数据,并且可以查询这些数据,你就可以快速地发展到更高级的Impala功能。 注意:在可行的情况下,本教程将带你从 "零起点 "到拥有所需的Impala表格和数据。在某些情况下 阅读全文
摘要:
修改Impala的启动选项 通过Impala守护进程的配置选项,您可以选择在单一主机上运行的服务使用哪些主机和端口,指定日志记录的目录,控制资源使用和安全性,并指定Impala软件的其他方面。 通过命令行配置 Impala 启动选项 Impala 服务器、stattore 和目录服务使用默认文件 / 阅读全文
摘要:
启动Impala 如果Impala已安装但尚未启动,则要激活它。 为 Impala 服务设置任何必要的配置选项。详情请参见修改Impala启动选项。 启动一个Impala状态存储的实例。状态存储帮助Impala有效地分配工作,并在其他Impala节点出现可用性问题时继续运行。如果stesttore变 阅读全文
摘要:
升级Impala 升级Impala涉及构建或获取新的Impala相关二进制文件,然后重新启动Impala服务。 升级Impala 关闭集群中所有相关主机上所有与 Impala 相关的守护进程. 停止集群中每个Impala节点上的impalad。$ sudo service impala-server 阅读全文
摘要:
Impala的安装后配置 本节介绍Impala的强制和推荐配置设置。如果使用群集管理软件安装Impala,其中一些配置可能会自动完成;您仍然必须手动配置短路读取。如果您想自定义环境,请考虑进行本主题中描述的更改。 无论Impala是否安装了群集管理软件,您都必须启用短路读取。此设置在 Impala 阅读全文
摘要:
安装Impala Impala是一个针对Apache Hadoop的开源分析数据库,可以快速返回查询响应。 按照以下步骤,通过从源码构建在集群上设置Impala。 下载最新版本。请参阅Impala下载页面以获取最新版本的链接。 检查 README.md 文件,以获得指向构建说明的指针。 请检查MD5 阅读全文
摘要:
Impala方案设计指南 本主题中的指南可以帮助你构建一个优化的、可扩展的模式,这个模式可以与你现有的数据管理流程很好地集成。在进行任何概念验证工作、移植工作或部署到生产中之前,请将这些准则作为检查表。 如果您正在改编现有数据库或 Hive 模式以用于 Impala,请阅读本节中的指导原则,然后参阅 阅读全文
摘要:
Impala要求 为了达到预期的性能,Impala取决于以下各节所述的软件、硬件和配置的可用性。 支持的操作系统 Apache Impala仅在Linux系统上运行。更多信息请参见 README.md 文件。 Hive Metastore和相关配置 Impala可以与存储在Hive中的数据互操作,并 阅读全文
摘要:
Impala部署规划 在生产中设置Impala之前,先做一些规划,以确保你的硬件设置有足够的容量,你的集群拓扑是Impala查询的最佳选择,你的模式设计和ETL流程遵循Impala的最佳实践。 Impala官网翻译07-Impala要求 Impala官网翻译08-Impala方案设计指南 阅读全文
摘要:
Impala如何融入Hadoop生态系统? Impala 利用了 Hadoop 生态系统中许多熟悉的组件。Impala可以作为消费者和生产者与其他Hadoop组件进行数据交换,因此它可以以灵活的方式适应您的ETL和ELT管道。 Impala如何与Hive合作 Impala的一个主要目标是使SQL-o 阅读全文
摘要:
开发Impala应用程序 Impala的核心开发语言是SQL。您也可以使用 Java 或其他语言通过许多商业智能工具使用的标准 JDBC 和 ODBC 接口与 Impala 进行交互。对于特殊类型的分析,您可以通过用C++或Java编写用户定义函数(UDF)来补充SQL内置函数。 Impala SQ 阅读全文
摘要:
Impala服务器的组件 Impala服务器是一个分布式的大规模并行处理(MPP)数据库引擎。它由不同的守护进程组成,这些进程在集群内的特定主机上运行。 Impala后台 Impala的核心组件是Impala守护进程,物理上由impalad进程表示。Impala 守护进程执行的几个主要功能是。 读取 阅读全文
摘要:
Impala的概念和架构 以下各节提供了背景信息,以帮助您使用 Impala 及其功能提高工作效率。在适当的地方,解释包括上下文,以帮助理解Impala的各个方面与您可能已经熟悉的其他技术(如关系数据库管理系统和数据仓库)或其他Hadoop组件(如Hive、HDFS和HBase)的关系。 Impal 阅读全文
摘要:
介绍Apache Impala Impala直接对存储在HDFS、HBase或亚马逊简单存储服务(S3)中的Apache Hadoop数据提供快速、交互式的SQL查询。除了使用相同的统一存储平台,Impala还使用与Apache Hive相同的元数据、SQL语法(Hive SQL)、ODBC驱动程序 阅读全文