|NO.Z.00003|——————————|^^ 部署 ^^|——|Hadoop&Impala.V03|——|Impala.v03|环境部署.v01|

一、安装Impala
### --- [交互查询工具Impala] 

~~~     [Impala的安装及入门案例-安装步骤]
~~~     [Impala的安装及入门案例-配置详解] 
二、集群规划
服务名称 linux121 linux122 linux123
impala-catalogd 不安装 不安装 安装
impala-statestored 不安装 不安装 安装
impala-server 安装 安装 安装
### --- Impala⻆色

~~~     # impala-server:这个进程是Impala真正工作的进程,
~~~     官方建议把impala-server安装在datanode节点,更靠近数据(短路读取),进程名impalad
~~~     # impala-statestored:健康监控⻆色,主要监控impala-server,
~~~     impala-server出现异常时告知给其它impala-server;进程名叫做statestored
~~~     # impala-catalogd :管理理和维护元数据(Hive),impala更新操作;
~~~     把impala-server更新的元数据通知给其它impala-server,进程名catalogd
~~~     # 官方建议statestore与catalog安装在同一节点上!!
三、具体安装步骤
### --- Linux123

[root@linux123 ~]# yum install impala -y
[root@linux123 ~]# yum install impala-server -y
[root@linux123 ~]# yum install impala-state-store -y
[root@linux123 ~]# yum install impala-catalog -y
[root@linux123 ~]# yum install impala-shell -y
### --- Linux121与Linux122

[root@linux121 ~]# yum install impala-server -y
[root@linux121 ~]# yum install impala-shell -y
四、配置Impala
### --- 修改hive-site.xml

[root@linux121 ~]# vim /opt/yanqi/servers/hive-2.3.7/conf/hive-site.xml
        <!--指定metastore地址,之前添加过可以不用添加 -->
        <property>
                <name>hive.metastore.uris</name>
                <value>thrift://linux121:9083,thrift://linux123:9083</value>
        </property>
        <property>
                <name>hive.metastore.client.socket.timeout</name>
                <value>3600</value>
        </property>
### --- 分发Hive安装包到集群节点

[root@linux123 ~]# rsync-script /opt/yanqi/servers/hive-2.3.7/conf/hive-site.xml
~~~     # OR
[root@linux123 ~]# rsync -r /opt/yanqi/servers/hive-2.3.7/ linux122:/opt/yanqi/servers/
[root@linux123 ~]# rsync -r /opt/yanqi/servers/hive-2.3.7/ linux121:/opt/yanqi/servers/
### --- Linux123启动metastore服务

~~~     # Linux123启动metastore服务
[root@linux123 ~]# nohup hive --service metastore &
    
~~~     # 启动hiveserver2服务
[root@linux123 ~]# nohup hive --service hiveserver2 &
~~~     # 启动linux121上metastore
[root@linux121 ~]# nohup hive --service metastore &

~~~     # 查看启动的服务
 [root@linux123 ~]# ps -ef | grep RunJar
 org.apache.hadoop.hive.metastore.HiveMetaStore
 org.apache.hadoop.hive.metastore.hiveserver2
### --- 修改HDFS集群hdfs-site.xml配置HDFS集群的短路读取

~~~     # 什么是短路读取?
~~~     在HDFS中通过DataNode来读取数据。
~~~     但是,当客户端向DataNode请求读取文件时,
~~~     DataNode就会从磁盘读取该文件并通过TCP socket将数据发送到客户端。
~~~     所谓“短路”是指Client客户端直接读取文件。
~~~     很明显,这种情况只在客户端与数据放在同一地点(译者注:同一主机)时才有可能发生。
~~~     短路路读对于许多应用程序会带来重大的性能提升。
### --- 短路读取:

~~~     就是Client与DataNode属于同一节点,无需再经过网络传输数据,直接本地读取。
~~~     要配置短路本地读,需要验证本机Hadoop是否有libhadoop.so;
### --- 进入⼀下目录:

[root@linux123 ~]# ll /opt/yanqi/servers/hadoop-2.9.2/lib/native
lrwxrwxrwx 1 root root      18 Aug 12 21:15 libhadoop.so -> libhadoop.so.1.0.0
-rwxr-xr-x 1 root root  842132 Aug 12 21:15 libhadoop.so.1.0.0

 
 
 
 
 
 
 
 
 

Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
                                                                                                                                                   ——W.S.Landor

 

posted on   yanqi_vip  阅读(6)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示