cdh平台问题
问题背景:内容的不懂之处,可以私信博主。友好交流使用。主要针对的问题种类有:网络桥接报错、网卡文件问题(该问题主要看你的安装脚本文件里面写的是否和主机对应,也是运行环境的问题)、scm表中没有节点信息。
问题一:
描述:Restarting network (via systemctl): Job for network.service failed because the control process exited with error code. See "systemctl status network.service" and "journalctl -xe" for details.
[FAILED]
./step1_install.sh: line 28: ifconfig: command not found
./step1_install.sh: line 29: brctl: command not found
解决方法:缺少网络和桥接工具,yum在线安装:yum -y install net-tools bridge-utils
问题二:
描述:1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
valid_lft forever preferred_lft forever
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000
link/ether fa:eb:19:ae:d5:00 brd ff:ff:ff:ff:ff:ff
inet 192.168.50.108/24 brd 192.168.50.255 scope global eth0
valid_lft forever preferred_lft forever
inet6 fe80::f8eb:19ff:feae:d500/64 scope link
valid_lft forever preferred_lft forever
解决方法:因为网卡名和脚本文件设置有冲突,进入网卡所在的文件夹,修改网卡的文件名。(主要看自己的网卡文件在哪)
cd /etc/sysconfig/network-scripts
mv ifcfg-eth0 ifcfg-ens33
问题三:
描述:
使用以下命令进入数据库查看scm表:
mysql -uroot -p
输入数据库密码
use scm;
select * from HOSTS;
如果里面出现节点信息表示server启动完成。
如果里面没有节点信息,尝试以下方法解决。
解决方法:
进入cdh文件夹:
cd /tmp/cdh
修改step2_clustercfg.sh
vi step2_clustercfg.sh
按i进入
在该文件的这行后面加echo "$MynodeName" >/etc/hostname
保存并退出:
Esc
[shift]:
wq
问题四:
问题:有节点停留在激活界面一直不动
解决方法:在主节点里修改/opt/cm-5.7.6/etc/cloudera-scm-agent/config.ini里的service_host为主机地址,再按照以下方法解决
在cm界面安装时中途失败,需要重新安装:
关闭所有服务
#主节点
[root@CDH-DEV1 opt]# /opt/cm-5.7.6/etc/init.d/cloudera-scm-server stop
#主节点及其他节点
[root@CDH-DEV1 opt]# /opt/cm-5.7.6/etc/init.d/cloudera-scm-agent stop
删除agent uuid
rm -rf /opt/cm-5.7.6/lib/cloudera-scm-agent/*
删除数据库scm
mysql -uroot -p
>输入数据库密码
mysql> drop database scm;
mysql> exit;
重新配置scm数据库
/opt/cm-5.7.6/share/cmf/schema/scm_prepare_database.sh mysql -hlocalhost -uroot -p scm scm
在主机下执行下面代码(把<host-name>替换为/etc/hosts文件中正确的名称)
hostnamectl --transient set-hostname <host-name>
然后重启这台节点的cdh服务,等待一会就可以正常解析了。
最后启动Cloudera server和agent。
感悟:
这些问题都是比较繁琐,但是技术含量有限。所以遇到问题,应该及时想办法去看安装日志,找日志中的错误信息,日志是非常好的伙伴,注意使用好他。
例如:其中的节点安装时一共三个节点,两个都已经激活,可是任有一个不能激活。冷静下来想的应该是,这个节点和其他节点没有什么不同,可能是某个
环节出的错误,不必着急重装,可以先看看日志。