|NO.Z.00003|——————————|^^ 部署 ^^|——|Hadoop&Impala.V03|——|Impala.v03|环境部署.v01|

一、安装Impala

### --- [交互查询工具Impala] 

~~~     [Impala的安装及入门案例-安装步骤]
~~~     [Impala的安装及入门案例-配置详解]

二、集群规划

服务名称	linux121	linux122	linux123
impala-catalogd	不安装	不安装	安装
impala-statestored	不安装	不安装	安装
impala-server	安装	安装	安装

### --- Impala⻆色

~~~     # impala-server:这个进程是Impala真正工作的进程，
~~~     官方建议把impala-server安装在datanode节点，更靠近数据（短路读取）,进程名impalad
~~~     # impala-statestored:健康监控⻆色，主要监控impala-server,
~~~     impala-server出现异常时告知给其它impala-server;进程名叫做statestored
~~~     # impala-catalogd :管理理和维护元数据(Hive),impala更新操作；
~~~     把impala-server更新的元数据通知给其它impala-server,进程名catalogd
~~~     # 官方建议statestore与catalog安装在同一节点上！！

三、具体安装步骤

### --- Linux123

[root@linux123 ~]# yum install impala -y
[root@linux123 ~]# yum install impala-server -y
[root@linux123 ~]# yum install impala-state-store -y
[root@linux123 ~]# yum install impala-catalog -y
[root@linux123 ~]# yum install impala-shell -y

### --- Linux121与Linux122

[root@linux121 ~]# yum install impala-server -y
[root@linux121 ~]# yum install impala-shell -y

四、配置Impala

### --- 修改hive-site.xml

[root@linux121 ~]# vim /opt/yanqi/servers/hive-2.3.7/conf/hive-site.xml
        <!--指定metastore地址，之前添加过可以不用添加 -->
        <property>
                <name>hive.metastore.uris</name>
                <value>thrift://linux121:9083,thrift://linux123:9083</value>
        </property>
        <property>
                <name>hive.metastore.client.socket.timeout</name>
                <value>3600</value>
        </property>

### --- 分发Hive安装包到集群节点

[root@linux123 ~]# rsync-script /opt/yanqi/servers/hive-2.3.7/conf/hive-site.xml
~~~     # OR
[root@linux123 ~]# rsync -r /opt/yanqi/servers/hive-2.3.7/ linux122:/opt/yanqi/servers/
[root@linux123 ~]# rsync -r /opt/yanqi/servers/hive-2.3.7/ linux121:/opt/yanqi/servers/

### --- Linux123启动metastore服务

~~~     # Linux123启动metastore服务
[root@linux123 ~]# nohup hive --service metastore &
    
~~~     # 启动hiveserver2服务
[root@linux123 ~]# nohup hive --service hiveserver2 &

~~~     # 启动linux121上metastore
[root@linux121 ~]# nohup hive --service metastore &

~~~     # 查看启动的服务
 [root@linux123 ~]# ps -ef | grep RunJar
 org.apache.hadoop.hive.metastore.HiveMetaStore
 org.apache.hadoop.hive.metastore.hiveserver2

### --- 修改HDFS集群hdfs-site.xml配置HDFS集群的短路读取

~~~     # 什么是短路读取？
~~~     在HDFS中通过DataNode来读取数据。
~~~     但是，当客户端向DataNode请求读取文件时，
~~~     DataNode就会从磁盘读取该文件并通过TCP socket将数据发送到客户端。
~~~     所谓“短路”是指Client客户端直接读取文件。
~~~     很明显，这种情况只在客户端与数据放在同一地点（译者注：同一主机）时才有可能发生。
~~~     短路路读对于许多应用程序会带来重大的性能提升。

### --- 短路读取：

~~~     就是Client与DataNode属于同一节点，无需再经过网络传输数据，直接本地读取。
~~~     要配置短路本地读，需要验证本机Hadoop是否有libhadoop.so;

### --- 进入⼀下目录：

[root@linux123 ~]# ll /opt/yanqi/servers/hadoop-2.9.2/lib/native
lrwxrwxrwx 1 root root      18 Aug 12 21:15 libhadoop.so -> libhadoop.so.1.0.0
-rwxr-xr-x 1 root root  842132 Aug 12 21:15 libhadoop.so.1.0.0

Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart

——W.S.Landor