摘要: Impala教程 本节包括教程场景,演示软件安装后如何开始使用Impala。它的重点是加载数据的技术,因为一旦你在表中有了一些数据,并且可以查询这些数据,你就可以快速地发展到更高级的Impala功能。 注意:在可行的情况下,本教程将带你从 "零起点 "到拥有所需的Impala表格和数据。在某些情况下 阅读全文
posted @ 2021-02-05 14:09 田野与天 阅读(271) 评论(0) 推荐(0) 编辑
摘要: 修改Impala的启动选项 通过Impala守护进程的配置选项,您可以选择在单一主机上运行的服务使用哪些主机和端口,指定日志记录的目录,控制资源使用和安全性,并指定Impala软件的其他方面。 通过命令行配置 Impala 启动选项 Impala 服务器、stattore 和目录服务使用默认文件 / 阅读全文
posted @ 2021-02-05 13:46 田野与天 阅读(560) 评论(0) 推荐(0) 编辑
摘要: 启动Impala 如果Impala已安装但尚未启动,则要激活它。 为 Impala 服务设置任何必要的配置选项。详情请参见修改Impala启动选项。 启动一个Impala状态存储的实例。状态存储帮助Impala有效地分配工作,并在其他Impala节点出现可用性问题时继续运行。如果stesttore变 阅读全文
posted @ 2021-02-05 13:06 田野与天 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 升级Impala 升级Impala涉及构建或获取新的Impala相关二进制文件,然后重新启动Impala服务。 升级Impala 关闭集群中所有相关主机上所有与 Impala 相关的守护进程. 停止集群中每个Impala节点上的impalad。$ sudo service impala-server 阅读全文
posted @ 2021-02-05 13:02 田野与天 阅读(522) 评论(0) 推荐(0) 编辑
摘要: Impala的安装后配置 本节介绍Impala的强制和推荐配置设置。如果使用群集管理软件安装Impala,其中一些配置可能会自动完成;您仍然必须手动配置短路读取。如果您想自定义环境,请考虑进行本主题中描述的更改。 无论Impala是否安装了群集管理软件,您都必须启用短路读取。此设置在 Impala 阅读全文
posted @ 2021-02-05 12:08 田野与天 阅读(296) 评论(0) 推荐(0) 编辑
摘要: 安装Impala Impala是一个针对Apache Hadoop的开源分析数据库,可以快速返回查询响应。 按照以下步骤,通过从源码构建在集群上设置Impala。 下载最新版本。请参阅Impala下载页面以获取最新版本的链接。 检查 README.md 文件,以获得指向构建说明的指针。 请检查MD5 阅读全文
posted @ 2021-02-05 11:58 田野与天 阅读(195) 评论(0) 推荐(0) 编辑
摘要: Impala方案设计指南 本主题中的指南可以帮助你构建一个优化的、可扩展的模式,这个模式可以与你现有的数据管理流程很好地集成。在进行任何概念验证工作、移植工作或部署到生产中之前,请将这些准则作为检查表。 如果您正在改编现有数据库或 Hive 模式以用于 Impala,请阅读本节中的指导原则,然后参阅 阅读全文
posted @ 2021-02-05 11:56 田野与天 阅读(134) 评论(0) 推荐(0) 编辑
摘要: Impala要求 为了达到预期的性能,Impala取决于以下各节所述的软件、硬件和配置的可用性。 支持的操作系统 Apache Impala仅在Linux系统上运行。更多信息请参见 README.md 文件。 Hive Metastore和相关配置 Impala可以与存储在Hive中的数据互操作,并 阅读全文
posted @ 2021-02-05 11:52 田野与天 阅读(277) 评论(0) 推荐(0) 编辑
摘要: Impala部署规划 在生产中设置Impala之前,先做一些规划,以确保你的硬件设置有足够的容量,你的集群拓扑是Impala查询的最佳选择,你的模式设计和ETL流程遵循Impala的最佳实践。 Impala官网翻译07-Impala要求 Impala官网翻译08-Impala方案设计指南 阅读全文
posted @ 2021-02-05 11:44 田野与天 阅读(94) 评论(0) 推荐(0) 编辑
摘要: Impala如何融入Hadoop生态系统? Impala 利用了 Hadoop 生态系统中许多熟悉的组件。Impala可以作为消费者和生产者与其他Hadoop组件进行数据交换,因此它可以以灵活的方式适应您的ETL和ELT管道。 Impala如何与Hive合作 Impala的一个主要目标是使SQL-o 阅读全文
posted @ 2021-02-05 11:37 田野与天 阅读(126) 评论(0) 推荐(0) 编辑
摘要: 开发Impala应用程序 Impala的核心开发语言是SQL。您也可以使用 Java 或其他语言通过许多商业智能工具使用的标准 JDBC 和 ODBC 接口与 Impala 进行交互。对于特殊类型的分析,您可以通过用C++或Java编写用户定义函数(UDF)来补充SQL内置函数。 Impala SQ 阅读全文
posted @ 2021-02-05 11:35 田野与天 阅读(206) 评论(0) 推荐(0) 编辑
摘要: Impala服务器的组件 Impala服务器是一个分布式的大规模并行处理(MPP)数据库引擎。它由不同的守护进程组成,这些进程在集群内的特定主机上运行。 Impala后台 Impala的核心组件是Impala守护进程,物理上由impalad进程表示。Impala 守护进程执行的几个主要功能是。 读取 阅读全文
posted @ 2021-02-05 11:32 田野与天 阅读(171) 评论(0) 推荐(0) 编辑
摘要: Impala的概念和架构 以下各节提供了背景信息,以帮助您使用 Impala 及其功能提高工作效率。在适当的地方,解释包括上下文,以帮助理解Impala的各个方面与您可能已经熟悉的其他技术(如关系数据库管理系统和数据仓库)或其他Hadoop组件(如Hive、HDFS和HBase)的关系。 Impal 阅读全文
posted @ 2021-02-05 11:29 田野与天 阅读(94) 评论(0) 推荐(0) 编辑
摘要: 介绍Apache Impala Impala直接对存储在HDFS、HBase或亚马逊简单存储服务(S3)中的Apache Hadoop数据提供快速、交互式的SQL查询。除了使用相同的统一存储平台,Impala还使用与Apache Hive相同的元数据、SQL语法(Hive SQL)、ODBC驱动程序 阅读全文
posted @ 2021-02-05 11:25 田野与天 阅读(359) 评论(0) 推荐(0) 编辑