Hive集成Atlas增量导入元数据失效问题

一、Hive客户端报错内容

22/06/08 11:49:04 WARN clients.NetworkClient: [Producer clientId=producer-1] Bootstrap broker xxx.xxx.xx.xxx:9092 (id: -1 rack: null) disconnected

  大致的原因就是Kafka连接不上

二、定位问题

  找了半天,最后检查Kafka也是没有什么问题的,原因在于之前修改了atlas配置文件,添加了kafka的sasl验证,而Hive的lib目录下的atlas-hive-plugin-impl/atlas-intg-2.1.0.jar 包中保存的配置文件又是旧的,所以自然就会报错

三、解决

  将最新的atlas-application.properties重新压至atlas-intg-2.1.0.jar包即可,压缩命令如下:

zip -u atlas/hook/hive/atlas-hive-plugin-impl/atlas-intg-2.1.0.jar atlas-application.properties

  完成之后再将atlas/hook/hive/目录下的所有文件拷贝至Hive的lib目录

cp -r atlas/hook/hive/* /opt/cloudera/parcels/CDH/lib/hive/lib

四、最后测试,发现Kafka的ATLAS_HOOK出现数据,Atlas也能查询出增量导入的元数据

posted @ 2022-06-08 14:56  宜家数据小哥  阅读(402)  评论(0编辑  收藏  举报