Fork me on GitHub

cdh平台问题

问题背景:内容的不懂之处,可以私信博主。友好交流使用。主要针对的问题种类有:网络桥接报错、网卡文件问题(该问题主要看你的安装脚本文件里面写的是否和主机对应,也是运行环境的问题)、scm表中没有节点信息。

 

问题一:

描述:Restarting network (via systemctl): Job for network.service failed because the control process exited with error code. See "systemctl status network.service" and "journalctl -xe" for details.

[FAILED]

./step1_install.sh: line 28: ifconfig: command not found

./step1_install.sh: line 29: brctl: command not found

解决方法:缺少网络和桥接工具,yum在线安装:yum -y install net-tools bridge-utils

 

问题二:

描述:1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000

link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00

inet 127.0.0.1/8 scope host lo

valid_lft forever preferred_lft forever

inet6 ::1/128 scope host

valid_lft forever preferred_lft forever

2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000

link/ether fa:eb:19:ae:d5:00 brd ff:ff:ff:ff:ff:ff

inet 192.168.50.108/24 brd 192.168.50.255 scope global eth0

valid_lft forever preferred_lft forever

inet6 fe80::f8eb:19ff:feae:d500/64 scope link

valid_lft forever preferred_lft forever

解决方法:因为网卡名和脚本文件设置有冲突,进入网卡所在的文件夹,修改网卡的文件名。(主要看自己的网卡文件在哪)

cd /etc/sysconfig/network-scripts

mv ifcfg-eth0 ifcfg-ens33

 

问题三:

描述:

使用以下命令进入数据库查看scm表:

mysql -uroot -p

输入数据库密码

use scm;

select * from HOSTS;

如果里面出现节点信息表示server启动完成。

如果里面没有节点信息,尝试以下方法解决。

解决方法:

进入cdh文件夹:

cd /tmp/cdh

修改step2_clustercfg.sh

vi step2_clustercfg.sh

i进入

文件的这行后面加echo "$MynodeName" >/etc/hostname

保存并退出:

Esc

[shift]:

wq

 

问题四:

问题:有节点停留在激活界面一直不动

解决方法:在主节点里修改/opt/cm-5.7.6/etc/cloudera-scm-agent/config.ini里的service_host为主机地址,再按照以下方法解决

 

在cm界面安装时中途失败,需要重新安装:

 

关闭所有服务

 

#主节点

 

[root@CDH-DEV1 opt]# /opt/cm-5.7.6/etc/init.d/cloudera-scm-server stop

 

#主节点及其他节点

 

[root@CDH-DEV1 opt]# /opt/cm-5.7.6/etc/init.d/cloudera-scm-agent stop

 

 

 

删除agent uuid

 

rm -rf /opt/cm-5.7.6/lib/cloudera-scm-agent/*

 

 

 

删除数据库scm

 

mysql -uroot -p

 

>输入数据库密码

 

mysql> drop database scm;

 

mysql> exit;

 

 

 

重新配置scm数据库

 

/opt/cm-5.7.6/share/cmf/schema/scm_prepare_database.sh mysql -hlocalhost -uroot -p scm scm

 

在主机下执行下面代码(把<host-name>替换为/etc/hosts文件中正确的名称)

 

hostnamectl --transient set-hostname <host-name>

 

然后重启这台节点的cdh服务,等待一会就可以正常解析了。

 

最后启动Cloudera server和agent。

 

 

 感悟:

这些问题都是比较繁琐,但是技术含量有限。所以遇到问题,应该及时想办法去看安装日志,找日志中的错误信息,日志是非常好的伙伴,注意使用好他。

例如:其中的节点安装时一共三个节点,两个都已经激活,可是任有一个不能激活。冷静下来想的应该是,这个节点和其他节点没有什么不同,可能是某个

环节出的错误,不必着急重装,可以先看看日志。

 

 

 

 

 

 

posted @ 2019-12-02 14:54  云笙Aaron  阅读(384)  评论(1编辑  收藏  举报