|NO.Z.00003|——————————|^^ 部署 ^^|——|Hadoop&Impala.V03|——|Impala.v03|环境部署.v01|
一、安装Impala
### --- [交互查询工具Impala]
~~~ [Impala的安装及入门案例-安装步骤]
~~~ [Impala的安装及入门案例-配置详解]
二、集群规划
服务名称 | linux121 | linux122 | linux123 |
impala-catalogd | 不安装 | 不安装 | 安装 |
impala-statestored | 不安装 | 不安装 | 安装 |
impala-server | 安装 | 安装 | 安装 |
### --- Impala⻆色
~~~ # impala-server:这个进程是Impala真正工作的进程,
~~~ 官方建议把impala-server安装在datanode节点,更靠近数据(短路读取),进程名impalad
~~~ # impala-statestored:健康监控⻆色,主要监控impala-server,
~~~ impala-server出现异常时告知给其它impala-server;进程名叫做statestored
~~~ # impala-catalogd :管理理和维护元数据(Hive),impala更新操作;
~~~ 把impala-server更新的元数据通知给其它impala-server,进程名catalogd
~~~ # 官方建议statestore与catalog安装在同一节点上!!
三、具体安装步骤
### --- Linux123
[root@linux123 ~]# yum install impala -y
[root@linux123 ~]# yum install impala-server -y
[root@linux123 ~]# yum install impala-state-store -y
[root@linux123 ~]# yum install impala-catalog -y
[root@linux123 ~]# yum install impala-shell -y
### --- Linux121与Linux122
[root@linux121 ~]# yum install impala-server -y
[root@linux121 ~]# yum install impala-shell -y
四、配置Impala
### --- 修改hive-site.xml
[root@linux121 ~]# vim /opt/yanqi/servers/hive-2.3.7/conf/hive-site.xml
<!--指定metastore地址,之前添加过可以不用添加 -->
<property>
<name>hive.metastore.uris</name>
<value>thrift://linux121:9083,thrift://linux123:9083</value>
</property>
<property>
<name>hive.metastore.client.socket.timeout</name>
<value>3600</value>
</property>
### --- 分发Hive安装包到集群节点
[root@linux123 ~]# rsync-script /opt/yanqi/servers/hive-2.3.7/conf/hive-site.xml
~~~ # OR
[root@linux123 ~]# rsync -r /opt/yanqi/servers/hive-2.3.7/ linux122:/opt/yanqi/servers/
[root@linux123 ~]# rsync -r /opt/yanqi/servers/hive-2.3.7/ linux121:/opt/yanqi/servers/
### --- Linux123启动metastore服务
~~~ # Linux123启动metastore服务
[root@linux123 ~]# nohup hive --service metastore &
~~~ # 启动hiveserver2服务
[root@linux123 ~]# nohup hive --service hiveserver2 &
~~~ # 启动linux121上metastore
[root@linux121 ~]# nohup hive --service metastore &
~~~ # 查看启动的服务
[root@linux123 ~]# ps -ef | grep RunJar
org.apache.hadoop.hive.metastore.HiveMetaStore
org.apache.hadoop.hive.metastore.hiveserver2
### --- 修改HDFS集群hdfs-site.xml配置HDFS集群的短路读取
~~~ # 什么是短路读取?
~~~ 在HDFS中通过DataNode来读取数据。
~~~ 但是,当客户端向DataNode请求读取文件时,
~~~ DataNode就会从磁盘读取该文件并通过TCP socket将数据发送到客户端。
~~~ 所谓“短路”是指Client客户端直接读取文件。
~~~ 很明显,这种情况只在客户端与数据放在同一地点(译者注:同一主机)时才有可能发生。
~~~ 短路路读对于许多应用程序会带来重大的性能提升。
### --- 短路读取:
~~~ 就是Client与DataNode属于同一节点,无需再经过网络传输数据,直接本地读取。
~~~ 要配置短路本地读,需要验证本机Hadoop是否有libhadoop.so;
### --- 进入⼀下目录:
[root@linux123 ~]# ll /opt/yanqi/servers/hadoop-2.9.2/lib/native
lrwxrwxrwx 1 root root 18 Aug 12 21:15 libhadoop.so -> libhadoop.so.1.0.0
-rwxr-xr-x 1 root root 842132 Aug 12 21:15 libhadoop.so.1.0.0
Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
——W.S.Landor
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」