蓝鲸社区版5.0部署
1,安装环境准备
1.1 获取安装包
- 蓝鲸社区版包含部署脚本、产品软件和开源组件。蓝鲸提供完整包与分包的下载通道,请自行到下载地址按需获取。新装环境及新用户建议下载完整包使用。
- 下载地址: https://bk.tencent.com/download/
- 下载完成后,请核对MD5码。
1.2 节点资源准备
- 官方给出比较合理的初始配置,基于以下考虑:
- 1,分布式模块达到高可用至少三个节点,所以至少需要三个OS(物理机或虚拟机均可)
- 2,Bkdata是耗费资源最多的蓝鲸组件。请分配到4核16G以上的机器。
- 3,若日志检索,蓝鲸监控是主要使用场景,请给influxdb和elasticsearch模块更多的内存,更好磁盘性能比如SSD。
- 4,nginx模块所在的机器需要有对外提供服务,可访问的IP。这是蓝鲸平台的总入口。
- 5,如果需要有跨云管理需求,gse部署的机器需要有跨云的网络条件。
主机名 | IP地址 | 组件 |
---|---|---|
bknode1.bk.com | 10.0.0.1 | nginx,rabbitmq,kafka(config),zk(config),es,appt,fta,consul,bkdata(databus) |
bknode2.bk.com | 10.0.0.2 | mongodb,appo,kafka(config),zk(config),es,mysql,consul,bkdata(dataapi),beanstalk |
bknode3.bk.com | 10.0.0.3 | paas,cmdb,job,gse,license,kafka(config),zk(config),es,redis,influxdb,consul,bkdata(monitor) |
2,CentOS系统设置
- 系统版本:要求CentOS-7.0以上版本,推荐CentOS-7.5
2.1 关闭SELinux
- 检查SELinux的状态,如果它已经禁用,可以跳过后面的命令
sestatus
- 可以使用以下命令禁用SELinux,或者修改配置文件:
# 通过命令临时禁用SELinux
setenforce 0
# 通过命令永久禁用SELinux
sed -i '/^SELINUX=/ s/enforcing/disabled/' /etc/selinux/config
- 接着,重启机器:
reboot
2.2 安装rsync命令
- 安装脚本依赖rsync分发同步文件。
# 检查是否有rsync命令,如果有返回rsync路径,可以跳过后面的命令
which rsync
# 安装rsync
yum -y install rsync
2.3 关闭防火墙(firewalld) 和 NetworkManager
- firewalld
systemctl stop firewalld
systemctl disable firewalld &>/dev/null
- NetworkManager
systemctl stop NetworkManager.service
systemctl disable NetworkManager.service &>/dev/null
2.4 调整最大文件打开数
- 检查当前root账号下的max open files值
ulimit -n
- 修改limit配置文件
cat >> /etc/security/limits.conf <<EOF
* soft nproc 65530
* hard nproc 65530
* soft nofile 65530
* hard nofile 65530
EOF
- 命令行设置临时生效
# -n 每个进程可以同时打开的最大文件数
ulimit -n 65535
# -u 可以运行的最大并发进程数
ulimit -u 20480
2.5 确认服务器时间同步
- 服务器后台时间不同步会对时间敏感的服务带来不可预见的后果。务必在安装和使用蓝鲸时保证时间同步。
- 检查每台机器当前时间和时区是否一致,若相互之间差别大于3s(考虑批量执行时的时差),建议校时。
date -R
- 查看和ntp server的时间差异(需要外网访问,如果内网有ntpd服务器,自行替换域名为该服务的地址)
ntpdate -d cn.pool.ntp.org
- 如果输出的最后一行offset大于1s建议校时,和ntp服务器同步时间
ntpdate cn.pool.ntp.org
2.6 检查是否存在全局HTTP代理
- 蓝鲸服务器之间会有的http请求,如果存在http代理,且未能正确代理这些请求,会发生不可预见的错误。
- 检查http_proxy https_proxy变量是否设置,若为空可以跳过后面的操作
echo "$http_proxy" "$https_proxy"
- 对于本机配置http_proxy变量的方式,请依次查找文件/etc/profile、/etc/bashrc、$HOME/.bashrc等是否有设置。 或者咨询网络管理员/IT部门协助处理。
3,安装部署
- 选择任意一台机器作为蓝鲸的运维中控机,例如:bknode1.bk.com
3.1 解压部署安装包
- 将下载的蓝鲸社区版完整包上传到中控机,并解压到 同级 目录下。以解压到/data 目录为例:
tar zxf bkce_src-5.0.3.tar.gz -C /data
- 解压之后, 得到两个目录: src, install
- src: 存放蓝鲸产品软件, 以及依赖的开源组件
- install: 存放安装部署脚本、安装时的参数配置、日常运维脚本等
3.2 配置 YUM 源 和 PIP 包
3.2.1 在线 YUM 源 和 PIP 包
3.2.1.1 腾讯云CentOS
- 备份系统旧配置文件
mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup
- 获取对应版本的CentOS-Base.repo 到/etc/yum.repos.d/目录
# centos7
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.cloud.tencent.com/repo/centos7_base.repo
- 更新缓存
yum clean all
yum makecache
3.2.1.2 腾讯云EPEL
- EPEL (Extra Packages for Enterprise Linux) 是由 Fedora Special Interest Group 为企业 Linux 创建、维护和管理的一个高质量附加包集合适用于但不仅限于 Red Hat Enterprise Linux (RHEL), CentOS, Scientific Linux (SL), Oracle Linux (OL)
- 备份系统旧配置文件
mv /etc/yum.repos.d/epel.repo /etc/yum.repos.d/epel.repo.backup
- 获取对应版本的epel配置文件到/etc/yum.repos.d/目录
# epel(RHEL7系列)
wget -O /etc/yum.repos.d/epel.repo http://mirrors.cloud.tencent.com/repo/epel-7.repo
- 更新缓存
yum clean all
yum makecache
3.2.1.3 PIP 源
- (4.0版本需要准备,没有这个目录和文件,需要创建) # 5.0不需要
# 腾讯云 PIP 源
$ cat /data/src/.pip/pip.conf
[global]
index-url = http://mirrors.cloud.tencent.com/pypi/simple
trusted-host = mirrors.cloud.tencent.com
# 阿里云 PIP 源
$ /data/src/.pip/pip.conf
[global]
index-url = http://mirrors.aliyun.com/pypi/simple
trusted-host = mirrors.aliyun.com
3.2.2 离线 YUM 源 和 PIP 包
- 方法一:在有公网的情况下搭建一套完整的蓝鲸平台,下载打包所需的依赖rpm包
- 方法二:在有公网的情况下,下载解压官方安装包,在脚本
install/dependences.env
文件中查看所有角色所依赖的组件,下载打包所需的依赖rpm包
3.2.2.1 离线 YUM 源,方法一
- 配置yum安装保留rpm包
# grep 'keepcache' /etc/yum.conf
keepcache=1
- 打包下载的rpm包
find /var/cache/ -type f -name "*.rpm" | xargs -i cp {} /opt/bk_repo/
cd /opt
tar zcvf bk_rpm.tar.gz bk_repo
3.2.2.2 离线 YUM 源,方法二
- 下载官方安装包
- 蓝鲸平台所依赖的组件都已经包含在安装脚本的
install/dependences.env
文件中,查看所有角色所依赖的组件。
$ cat dependences.env
# 依赖包设置, 需要通过yum 安装的依赖包放在这里.
source ./utils.fc
load_functions dependences third
load_functions dependences extra
commands=(zip unzip pidof pkill rsync gawk curl lsof tar sed iproute uuid psmisc wget)
required=(openssl-devel readline-devel libcurl-devel libxml2-devel glibc-devel zlib-devel iproute sysvinit-tools procps-ng bind-utils)
open_paas_required=(gcc mysql mysql-devel libevent-devel bzip2-devel sqlite-devel tk-devel gdbm-devel db4-devel libpcap-devel xz-devel pcre-devel svn nfs-utils)
paas_agent_required=(mysql-devel gcc libevent-devel git svn nfs-utils)
cmdb_required=(nginx)
fta_required=(mysql-devel gcc libevent-devel patch)
mysql_required=(libaio-devel)
consul_required=()
gse_required=()
fta_required=(mysql-devel gcc libevent-devel patch)
job_required=(libcurl nfs-utils)
bkdata_required=(openssl-devel ncurses-devel mysql-devel python-devel gcc gcc-c++ make cmake bison-devel ncurses-devel pcre-devel readline-devel snappy-devel patch snappy snappy-devel)
rabbitmq_required=(gcc make cmake gcc-c++ socat)
zabbix_required=(zabbix-server zabbix-agent php)
bkdata_dependson=(license cmdb paas redis kafka zk es beanstalk consul)
cmdb_dependson=(nginx license mongodb redis consul)
job_dependson=(nginx redis mysql license rabbitmq paas gse cmdb consul)
paas_dependson=(nginx redis mysql license consul)
appo_dependson=(paas nginx license rabbitmq)
- 对该文件的其它内容进行注释,l留下定义变量的内容
$ cat dependences.env
# 依赖包设置, 需要通过yum 安装的依赖包放在这里.
#source ./utils.fc
#load_functions dependences third
#load_functions dependences extra
- 然后加载该文件,让所有的变量加载到系统中
$ source dependences.env
$ echo ${commands[@]}
zip unzip pidof pkill rsync gawk curl lsof tar sed iproute uuid psmisc wget
- 使用yum进行下载,但不安装。
yum install ${commands[@]} --downloadonly --downloaddir=/opt/bk_repo/
- 打包下载的rpm包
cd /opt
tar zcvf bk_rpm.tar.gz bk_repo
3.2.2.3 配置本地 YUM REPO 源
- 创建repo索引
createrepo bk_repo
- 编写yum源配置文件
cat > /etc/yum.repos.d/bk_repo.repo << EOF
[bk_repo]
name=bk_repo
baseurl=file:///mnt/repo/
gpgcheck=0
enabled=1
EOF
- 更新缓存
yum clean all
yum makecache
3.2.2.4 在安装部署时,依赖包冲突报错,根据报错情况下载对应的依赖包
# 查找报错rpm包
rpm -qa | grep pkg_name.rpm
# 卸载报错对应rpm包
rpm -e pkg_name.rpm
# 安装报错对应rpm包
rpm -Uvh pkg_name.rpm
# 强制执行参数
--nodeps
3.2.2.5 获取该版本下的 PIP 包
-
PIP包蓝鲸自带了离线包,所以无需单独下载。 不过bkdata和fta自带的包可能会和安装时的操作系统不匹配,导致安装失败
-
在有网络环境下,可以用以下方式下载pip包:
pip install --download /pip -r requirements.txt # 旧版 pip 下载方式
pip download -d /pip -r requirements.txt # pip 9, 10 版本的下载方式
- 获取 pip 安装包 requirements.txt 路径,以及下载离线包后应该存放的路径。
$ find /data/src/ -type f -name "requirements.txt"
# bkdata 所需的 pip 包
/data/src/bkdata/monitor/requirements.txt
/data/src/bkdata/dataapi/metaapi/requirements.txt
/data/src/bkdata/dataapi/requirements.txt
/data/src/bkdata/dataapi/ja/requirements.txt
# 需要放到以下路径
/data/src/bkdata/support-files/pkgs
# paas_agent下的 pip 包其实时给SaaS部署用的。
/data/src/paas_agent/support-files/pkgs/requirements.txt
/data/src/paas_agent/paas_agent/etc/build/packages/requirements.txt
/data/src/paas_agent/paas_agent/requirements.txt
# 需要放到以下路径
/data/src/paas_agent/support-files/pkgs
# open_paas 角色所需的 pip 包
/data/src/open_paas/support-files/pkgs/requirements.txt
/data/src/open_paas/paas/requirements.txt
/data/src/open_paas/login/requirements.txt
/data/src/open_paas/esb/requirements.txt
/data/src/open_paas/appengine/requirements.txt
# 需要放到以下路径
/data/src/open_paas/support-files/pkgs
# fta 角色所需的 pip 包
/data/src/fta/fta/project/conf/requirements.txt
/data/src/fta/fta/requirements.txt
# 需要放到以下路径
/data/src/fta/support-files/pkgs
3.3 配置文件
- 在 install 目录下, 共有三个配置
install.config
globals.env
ports.env
3.3.1 install.config
- install.config 是模块和服务器对应关系的配置文件,描述在哪些机器上安装哪些模块。 每行两列,第一列是IP地址;第二列是以英文逗号分隔的模块名称。 详情参考install.config.3IP.sample文件(可将install.config.3IP.sample 复制为install.config)。
[bkce-basic]
10.0.0.1 nginx,rabbitmq,kafka(config),zk(config),es,appt,fta,consul,bkdata(databus)
10.0.0.2 mongodb,appo,kafka(config),zk(config),es,mysql,consul,bkdata(dataapi),beanstalk
10.0.0.3 paas,cmdb,job,gse,license,kafka(config),zk(config),es,redis,influxdb,consul,bkdata(monitor)
- 说明:
- 该配置文件,ip 后面使用空格与服务名称隔开,含有多个内网 ip 的机器,默认使用 /sbin/ifconfig 输出中的第一个内网ip, 在 ip 后面写上该机器要安装的服务列表即可, 部署过程中默认使用标准私有地址, 若企业环境使用非标准私有地址, 请参考非标准内网ip处理的处理方法。
- zk 表示 zookeeper, es 表示 elasticsearch
- gse 与 redis 需要部署在同一台机器上
- gse 若需要跨云支持, gse 所在机器必须有外网 IP
- 增加机器数量时, 可以将以上配置中的服务挪到新的机器上,分担负载。 要保证: kafka, es, zk 的每个组件的总数量为3
3.3.1.1 非标准私有地址处理方法
- 蓝鲸社区版部署脚本中(install目录和src目录)下有以下文件中有获取 ip 的函数 get_lan_ip, 非标准地址, 均需要在安装部署前完成修改。
src/job/support-files/sql/0003_job_ce_20180712-1002_mysql.sql
src/gse/plugins_windows_x86/bin/stop.sh
src/gse/plugins_windows_x86/bin/start.sh
src/gse/plugins_windows_x86/bin/reload.sh
src/gse/plugins_linux_x86_64/bin/stop.sh
src/gse/plugins_linux_x86_64/bin/start.sh
src/gse/plugins_linux_x86_64/bin/reload.sh
src/gse/agent_linux_x86_64/bin/gsectl
src/gse/plugins_windows_x86_64/bin/stop.sh
src/gse/plugins_windows_x86_64/bin/start.sh
src/gse/plugins_windows_x86_64/bin/reload.sh
src/gse/plugins_linux_x86/bin/stop.sh
src/gse/plugins_linux_x86/bin/start.sh
src/gse/plugins_linux_x86/bin/reload.sh
src/gse/server/bin/gsectl
src/gse/agent_linux_x86/bin/gsectl
src/gse/proxy/bin/gsectl
install/appmgr/docker/saas/buildsaas
install/appmgr/docker/build
install/agent_setup/download#agent_setup.sh
install/agent_setup/download#agent_setup_pro.sh
install/agent_setup/download#agent_setup_aix.ksh
install/scripts/gse/plugins/stop.sh
install/scripts/gse/plugins/start.sh
install/scripts/gse/plugins/reload.sh
install/scripts/gse/server/gsectl
install/scripts/gse/agent/gsectl
install/scripts/gse/proxy/gsectl
install/scripts/gse/agentaix/gsectl.ksh
install/precheck.sh
install/functions
- 这些文件列表,可能随版本迭代变动,也可以用以下命令查找出来包含这个函数的脚本文件有哪些:
grep -l 'get_lan_ip *()' -r /data/install
- 修改方法:
- 假设服务器的ip是:138.x.x.x,它不在标准的私有地址范围,那么你需要修改get_lan_ip ()函数:
- 假设服务器有多个网卡,需要过滤出正确的网卡,例如:eth1
# ip addr 获取IP地址
get_lan_ip () {
#
ip addr | grep -A5 -E ' eth1:' | \
awk -F'[ /]+' '/inet/{
split($3, N, ".")
if ($3 ~ /^192.168/) {
print $3
}
if (($3 ~ /^172/) && (N[2] >= 16) && (N[2] <= 31)) {
print $3
}
if ($3 ~ /^10\./) {
print $3
}
}'
return $?
}
# ifconfig -a 获取IP地址
get_lan_ip () {
#
ifconfig -a | grep -A5 -E '^eth1:' | \
awk -F'[ /\t]+' '/inet/{
split($3, N, ".")
if ($3 ~ /^192.168/) {
print $3
}
if (($3 ~ /^172/) && (N[2] >= 16) && (N[2] <= 31)) {
print $3
}
if ($3 ~ /^10\./) {
print $3
}
}'
return $?
}
3.3.2 globals.env
-
该文件定义了各类组件的账号密码信息. 功能开关控制选项等. 可根据实际情况进行修改.
-
配置项含义, 请查看文件中的注释
- 该文件含密码信息,请保证除了root用户外,其他用户不可读。
- 各类账号密码建议修改, 注意设置的各类密码不能有 / $ ` < > &等特殊字符
- 配置HTTP代理: 若公司不能访问外网, 但有自己的 proxy, 在该配置文件的 BK_PROXY 选项中指定代理地址.
- 若需要跨云管理功能(服务器在不同的 IDC, 内网不互通的情况):
- 需要将 gse 所在机器的外网IP填到该文件中 GSE_WAN_IP 配置项中的括号里 如: export GSE_WAN_IP=(1.2.3.4), 若没有外网IP 则留空
- HAS_DNS_SERVER 配置默认为0,表示配置的蓝鲸域名需要通过/etc/hosts来解析,此时部署脚本会自动修改每台机器的/etc/hosts添加相关域名。如果想走自己的dns配置,改为非0即可。
- HTTP_SCHEMA=http 默认HTTP_SCHEMA设置为http即蓝鲸软件全站为http,若设置为https则蓝鲸软件全站为https,可支持http和https的切换。
-
该配置文件中提供了访问蓝鲸三大平台的域名配置, 需要提前准备好.
export BK_DOMAIN="bk.com" # 蓝鲸根域名(不含主机名)
export PAAS_FQDN="paas.$BK_DOMAIN" # PAAS 完整域名
export CMDB_FQDN="cmdb.$BK_DOMAIN" # CMDB 完整域名
export JOB_FQDN="job.$BK_DOMAIN" # JOB 完整域名
- 说明:
- BK_DOMAIN的值不能为"com" "net" 这种顶级域名, 至少二级域名开始。
- FQDN的选择需要遵循DNS的命名规范,可选的字符集是[A-Za-z0-9.]以及"-", 特别要注意,下划线(_)是不允许的。
- PAAS_FQDN CMDB_FQDN JOB_FQDN的值都必须在BK_DOMAIN定义的根域名之下,保证登陆鉴权的cookie文件有效。
3.3.3 ports.env
- 端口定义。 默认情况下, 不用修改。特殊场景下,若有端口冲突,可以自行定义。
3.4 获取证书
- 通过ifconfig或者ip addr命令获取install.config文件中,license和gse模块所在服务器的第一个内网网卡的MAC地址。如果分别属于两台服务器,那么两个的MAC地址以英文;分隔。
# 网卡名为:eth1
cat /sys/class/net/eth1/address
- 在官网证书生成页面
https://bk.tencent.com/download_ssl/
根据输入框提示填入MAC地址,生成并下载证书。 - 上传证书到中控机,并解压到 src/cert 目录下
tar xf ssl_certificates.tar.gz -C /data/src/cert/
3.5 配置 SSH 免密登陆
登录到中控机,执行以下操作
cd /data/install
bash configure_ssh_without_pass # 根据提示输入各主机的 root 密码完成免密登陆配置
3.6 安装前校验环境是否满足
- 按文档要求做完环境和部署的配置后,准备开始安装前,请运行以下脚本,来校验是否满足:
cd /data/install
bash precheck.sh
- 正常输出如下图所示:
start <<check_ssh_nopass>> ... [OK]
start <<check_password>> ... [OK]
start <<check_cert_mac>> ... [OK]
start <<check_get_lan_ip>> ... [OK]
start <<check_install_config>> ... [OK]
start <<check_selinux>> ... [OK]
start <<check_umask>> ... [OK]
start <<check_rabbitmq_version>> ... [OK]
start <<check_http_proxy>> ... [OK]
start <<check_open_files_limit>> ... [OK]
start <<check_domain>> ... [OK]
start <<check_rsync>> ... [OK]
start <<check_service_dir>> ... [OK]
start <<check_networkmanager>> ... [OK]
start <<check_firewalld>> ... [OK]
- 如果发现有[FAIL]的报错,按照提示和本文档修复。修复后,可继续跑precheck.sh脚本,直到不再出现[FAIL]。如果需要从头开始检查,请使用 precheck.sh -r 参数。
3.7 安装部署组件
- 在部署期间会自动解析添加到 /etc/hosts 和 /etc/resolv.conf,如果没有请自行添加
# cat /etc/hosts
10.0.0.1 bknode1.bk.com
10.0.0.1 paas.bk.com
10.0.0.1 cmdb.bk.com
10.0.0.1 job.bk.com
# cat /etc/resolv.conf
nameserver 127.0.0.1
- 按顺序执行,如果有报错,先解决报错再继续执行下一步
cd /data/install
# 该步骤后,可以打开 paas 平台
./bk_install paas # 安装paas 平台及其依赖服务
# 该步骤完成后, 可以打开 cmdb, 看到蓝鲸业务及示例业务
./bk_install cmdb # 安装 cmdb 及其依赖服务
# 该步骤完成后, 可以打开作业平台, 并执行作业
# 同时在配置平台中可以看到蓝鲸的模块下加入了主机
./bk_install job # 安装作业平台及其依赖组件,并在安装蓝鲸的服务器上装好 gse_agent 供验证
# 该步骤完成后可以在开发者中心的 服务器信息 和 第三方服务信息 中看到已经成功激活的服务器
# 同时也可以进行 saas 应用(除蓝鲸监控和日志检索)的上传部署
./bk_install app_mgr # 部署正式环境及测试环境
# 1. 通过./bk_install saas-o bk_nodeman 部署节点管理app, 或
# 2. 通过开发者中心部署app.
./bk_install saas-o bk_nodeman
# 安装该模块后,可以开始安 saas 应用: 蓝鲸监控及日志检索
./bk_install bkdata # 安装蓝鲸数据平台基础模块及其依赖服务
# 1. 通过./bk_install saas-o bk_monitor 部署 蓝鲸监控app, 或
# 2. 通过开发者中心部署 蓝鲸监控app
./bk_install saas-o bk_monitor
# 安装 fta 后台
./bk_install fta # 安装故障自愈的后台服务
# 1. 通过./bk_install saas-o bk_fta 部署故障自愈app, 或
# 2. 通过开发者中心部署故障自愈app
saas_o bk_fta
# 1. 通过./bk_install saas-o bk_fta_solutions 部署故障自愈app, 或
# 2. 通过开发者中心部署故障自愈app
./bk_install saas-o bk_fta_solutions
# 重装一下 gse_agent 并注册正确的集群模块到配置平台
./bkcec install gse_agent
# 部署官方SaaS到正式环境(通过命令行从/data/src/official_saas/目录自动部署SaaS)
./bkcec install saas-o
4,配置windows hosts 解析
# Windows10:
$ C:\Windows\System32\drivers\etc\hosts 文件末尾加上
10.0.0.1 paas.bk.com cmdb.bk.com job.bk.com
5,报错锦集
- 安装saas-o报错 No module named MySQLdb
# 在中控机 install 目录执行 /opt/py27/bin/pip install argparse requests mysql-python --no-index --find-links=./pip
# 再进行安装 ./bkcec install saas-o
- 安装 APPO 报错 activate appo failed. api:/v1/agent/init/?agent_ip=xxx, response:
# 查看日志是否提示证书验证失败 /data/bkce/logs/paas_agent/agent.log
# APPO机器执行 dig license.service.consul 解析失败,
# 在 /etc/resolv.conf 第一行添加 nameserver 127.0.0.1
# 重启APPO后重新安装恢复
- 启动cmdb_adminserver报错 cmdb_adminserver FATAL Exited too quickly (process log may have details)
# cmdb_adminserver 启动有异常基本就能判定是cmdb链接zk有问题。
# dig zk.service.consul
# "IN A" 后面没有 ip地址,说明consul 启动了,但是无法解析域名
# 在 /etc/resolv.conf 第一行添加 nameserver 127.0.0.1
# 重启服务
echo consul cmdb zk | xargs -n 1 ./bkcec stop
echo consul cmdb zk | xargs -n 1 ./bkcec start
- bkdata 报错 create topic failed. migrate failed for bkdata(dataapi)
## 注册kafka topic 失败,重启 kafka 即可
echo kafka | xargs -n 1 ./bkcec stop
echo kafka l cmdb zk | xargs -n 1 ./bkcec start
# 重启服务
echo bkdata | xargs -n 1 ./bkcec stop
echo bkdata | xargs -n 1 ./bkcec start
- 节点管理界面,安装卸载节点没有日志输出
1,在开发者中心-->s-mart应用-->找到需要重装的saas-->点击部署,如果不生效,执行下一步
2,在rabbitmq机器执行 rabbitmqctl delete_vhost prod_bk_nodeman 删除vhosts后
3,重新部署节点管理saas
4,如果不生效,先下架节点管理saas,执行 rabbitmqctrl 删除vhosts,再重新部署节点管理saas
- influxd 在部署完成后报接口调用404,暂未解决
Oct 20 15:47:11 bknode3 influxd: [httpd] 10.0.0.1 - - [20/Oct/2019:15:47:11 +0800] "POST /write?db=system_2 HTTP/1.1" 404 45 "-" "Java/1.8.0_171" d34e6c2f-f30d-11e9-83ca-000000000000 94