CDH学习笔记

1. Host Monitor 启动失败

  查看role日志,发现有端口占用问题,通过在 https://www.cloudera.com/documentation/enterprise/5-7-x/topics/cm_ig_ports_cm.html 上找到 Host Monitor 使用的几个端口,其中8091端口被其它程序占用,改成8092后重启成功。

2. 添加新节点报错

      在目标主机安装了agent, 然后通过web界面添加主机节点,因为在当前管理的主机列表里没找到目标主机,因此就在新主机那里搜索出来,然后勾选,点击继续,在最后一步安装时报错:error cannot retrieve repository metadata (repomd.xml) for repository。

    后来查找解决方法,在一篇博客里发现下面一段话:

5.1、由于已经将cm agent拷贝到各机器并启动了,此处不是通过IP或hostname查找的(即使查出来也无法选择),而是已存在的主机里面选择,选择新加的agent,点继续

  于是明白过来,问题出在前面,正常情况下在新主机上启动agent之后,当前管理的主机列表里面应该有新主机,没有是不正常的,然后检查agent的日志,发现有报错:protocolerror protocolerror for 127.0.0.1/rpc2 401 unauthorized,解决办法:

$> ps -ef | grep supervisord
$> kill -9 <processID>
$> /opt/cm-5.6.0/etc/init.d/cloudera-scm-agent restart

 参考:

https://blog.csdn.net/xiaolong_4_2/article/details/83113185

https://www.cnblogs.com/wangyufu/p/5453235.html

3. yarn 启动报错

 yarn 添加 nodemanager节点,启动报错:disallowed nodemanager from 【hostname】

 原因是将该主机添加到了排除名单中,查看resouce manager 日志发现,cdh每次都会动态生成新的yarn-site.xml, 里面定义的排除文件也是新的,因此直接删除该文件的方法不行,解决办法还在探索中。

posted @ 2019-05-29 14:24  codercg  阅读(411)  评论(0编辑  收藏  举报