DC/OS 安装部署

Table of Contents

Created by gh-md-toc

安装部署

硬件条件


安装 DC/OS 需要准备 1 台 bootstrap node (这个就是我们的工作机), 1台 或多台Mesos master nodes, 1 台 或多台 Mesos Agents。它们的配置需求也不大一样。

准备阶段


bootstrap node


一般可用我们的开发机用做 boostrap node,需要至少 2 cores, 16 G RAM, 60 G HDD,且在其上装下如下软件:

  • 如果使用 DC/OS CLI 的话,需要安装 Python, pip, virtualenv。 pip 需要配置一下,使其可以从 PyPI 或者我们自己的私有 PyPI 下载安装包

  • 一个 HA 的负载均衡,比如 HAProxy,用于将 80,443,8080,8181,2181,5050 等 TCP 端口均衡到所有的 mesos master 节点上

  • 一个未加密的 SSH key ,用它来访问所有的集群节点。目前,加密的还不支持

接下来对开发机做如下配置:

1、新建 genconf 目录

$ mkdir -p genconf

2、在 genconf 目录下创建 ip-detect 脚本文件,在安装 DC/OS 的时候,就是通过它进行找到 Mesos master,Agent 进行自动绑定 5050, 5051 等端口的。很重要

官方提供的版本在我们的环境中不可用,所以需要修改一下:

#!/usr/bin/env bash
set -o nounset -o errexit

MASTER_IP=10.221.82.185

# 官方版本
# echo $(/usr/sbin/ip route show to match 10.221.82.185 | grep -Eo '[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}' | tail -1)

# 内部使用版本
echo $(ip -d route get 10.221.82.185 | egrep -o 'src ([0-9.]*)' | grep -o '[0-9.]*')

3、创建配置文件并保存为 genconf/config.yaml

示例参考如下:

---
agent_list:
- 10.221.78.22
- 10.221.78.23
- 10.221.78.26
bootstrap_url: file:///opt/dcos_install_tmp
cluster_name: shgq-chenqiang-dcos
exhibitor_storage_backend: static
ip_detect_filename: /genconf/ip-detect
log_directory: /genconf/logs
master_discovery: static
master_list:
- 10.221.82.185
- 10.221.82.186
- 10.221.82.187
oauth_enabled: 'false'
process_timeout: 10000
resolvers:
- 10.121.32.85
- 10.121.32.86
ssh_port: 22
ssh_user: root

4、复制 ssh key 到 genconf 目录下,并命令为 genconf/ssh_key

$ cp <path-to-key> genconf/ssh_key && chmod 0600 genconf/ssh_key

Cluster nodes


Cluster nodes 主要是指集群中的 Master nodes 和 Agent nodes

Master nodes


需要至少 4 cores, 32 G RAM, 120 G HDD,由于在 master 节点上会有很多混合负载,比如 replicated log 和 ZooKeeper,还有一些是文件同步操作,比较耗 I/O,有条件的话,可以使用:

  • 固态硬盘

  • 有 BBU 的 RAID 卡

  • 有回写模式的 RAID 缓存配置

Agent nodes


需要至少 2 cores, 16 G RAM, 60 G HDD,它必须需要如下的东西:

  • 至少 10 G 的 /var 目录,这个主要存放 Docker 和 Mesos Containerizer 的 sandbox
  • 可访问外网 Docker repo 或者内网的 Docker registry

操作系统使用最新的 centos 7.2

$ sudo yum upgrade -y

禁掉防火墙

$ sudo systemctl stop firewalld && sudo systemctl disable firewalld

DC/OS 安装在 /opt/mesosphere 目录下,需要确保它不是在一个 LVM 的逻辑卷或者共享的存储上。

高级安装的话,需要在 Cluster nodes 上, 即 Master , Agent 节点上完成如下事项:

  • 需要有 UnZip, GNU tar, XZ Utils 等数据压缩工具

    $ sudo yum install -y tar xz unzip curl ipset

  • 禁掉 SELinux,将 nogroup 添加到 Mesos masters 和 Agents 中,然后重启机器

    $ sudo sed -i s/SELINUX=enforcing/SELINUX=permissive/g /etc/selinux/config &&
    sudo groupadd nogroup &&
    sudo reboot

部署阶段


部署 Master/Agent nodes


1、为简单方便,我们可以在新的所有 Cluster nodes 上部署 dep tag 即可。

$ ansible-playbook --limit=nodes -i hosts/xxx mesos.yaml --tags unguard

2、DC/OS 需要使用dns port 53, 由于在 dep 中 dnsmasq 会占用该端口, 所以暂停该端口。

$ ansible nodes -i hosts/xxx -m shell -a "systemctl stop dnsmasq"

部署 bootstrap node


1、下载或通过本项目生成 DC/OS Installer 到开发机的 根目录。自己生成的话,可参见官方 README.md 进行。

$ curl -O https://downloads.dcos.io/dcos/EarlyAccess/dcos_generate_config.sh

2、接下来可以通过网页安装或者命令行安装。

网页安装较简单,只需要执行如下命令,然后打开浏览器进入 http://<bootstrap-node-public-ip>:9000即可:

$ sudo bash dcos_generate_config.sh --web

我们采用命令行安装,将执行如下命令:

  • Step1:在 home 目录运行 DC/OS Installer 脚本来生成 DC/OS Build ,这个脚本会提取出一个 Docker 容器,并将通过的 DC/OS 安装文件为我们本地环境生成定制化的 DC/OS Build。 这个 Build 会放在 ./genconf/serve/ 目录下。

    $ sudo bash dcos_generate_config.sh --genconf

    执行该命令时,输出大概是这样的。

    Extracting image from this script and loading into docker daemon, this step can take a few minutes
    dcos-genconf.e060aa49ac4ab62d5e-1e14856f55e5d5d07b.tar
    Running mesosphere/dcos-genconf docker with BUILD_DIR set to /home/centos/genconf
    ====> EXECUTING CONFIGURATION GENERATION
    ...

    这个时候,我们的目录结构大概是这样的:

    ├── dcos-genconf.<HASH>.tar
    ├── dcos_generate_config.sh
    ├── genconf
    │   ├── config.yaml
    │   ├── ip-detect
    │   ├── cluster_packages.json
    │   ├── serve
    │   ├── ssh_key
    │   ├── state
  • Step2:安装一些集群所需的必要包

    $ sudo bash dcos_generate_config.sh --install-prereqs

    输出示例:

    Running mesosphere/dcos-genconf docker with BUILD_DIR set to /home/centos/genconf
    ====> dcos_installer.action_lib.prettyprint:: ====> EXECUTING INSTALL PREREQUISITES
    ====> dcos_installer.action_lib.prettyprint:: ====> START install_prereqs
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE install_prereqs
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE install_prereqs
    ====> dcos_installer.action_lib.prettyprint:: ====> END install_prereqs with returncode: 0
    ====> dcos_installer.action_lib.prettyprint:: ====> SUMMARY
    ====> dcos_installer.action_lib.prettyprint:: 2 out of 2 hosts successfully completed install_prereqs stage.
  • Step3: 执行 preflight 校验安装过程

    $ sudo bash dcos_generate_config.sh --preflight

    想看得详细一点的话,可以加上 -v 参数。

    示例输出:

    Running mesosphere/dcos-genconf docker with BUILD_DIR set to /home/centos/genconf
    ====> dcos_installer.action_lib.prettyprint:: ====> EXECUTING PREFLIGHT
    ====> dcos_installer.action_lib.prettyprint:: ====> START run_preflight
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE preflight
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE preflight
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE preflight_cleanup
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE preflight_cleanup
    ====> dcos_installer.action_lib.prettyprint:: ====> END run_preflight with returncode: 0
    ====> dcos_installer.action_lib.prettyprint:: ====> SUMMARY
    ====> dcos_installer.action_lib.prettyprint:: 2 out of 2 hosts successfully completed run_preflight stage.
  • Step 4: 开始安装 DC/OS 到我们的集群中了

    $ sudo bash dcos_generate_config.sh --deploy

    示例输出:

    Running mesosphere/dcos-genconf docker with BUILD_DIR set to /home/centos/genconf
    ====> dcos_installer.action_lib.prettyprint:: ====> EXECUTING DC/OS INSTALLATION
    ====> dcos_installer.action_lib.prettyprint:: ====> START deploy_master
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE deploy_master
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE deploy_master_cleanup
    ====> dcos_installer.action_lib.prettyprint:: ====> END deploy_master with returncode: 0
    ====> dcos_installer.action_lib.prettyprint:: ====> SUMMARY
    ====> dcos_installer.action_lib.prettyprint:: 1 out of 1 hosts successfully completed deploy_master stage.
    ====> dcos_installer.action_lib.prettyprint:: ====> START deploy_agent
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE deploy_agent
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE deploy_agent_cleanup
    ====> dcos_installer.action_lib.prettyprint:: ====> END deploy_agent with returncode: 0
    ====> dcos_installer.action_lib.prettyprint:: ====> SUMMARY
    ====> dcos_installer.action_lib.prettyprint:: 1 out of 1 hosts successfully completed deploy_agent stage.
  • Step5:运行 DC/OS 诊断脚本来核实服务是否起来并在运行

    $ sudo bash dcos_generate_config.sh --postflight

    示例输出:

    unning mesosphere/dcos-genconf docker with BUILD_DIR set to /home/centos/genconf
    ====> dcos_installer.action_lib.prettyprint:: ====> EXECUTING POSTFLIGHT
    ====> dcos_installer.action_lib.prettyprint:: ====> START run_postflight
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE postflight
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE postflight
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE postflight_cleanup
    ====> dcos_installer.action_lib.prettyprint:: ====> STAGE postflight_cleanup
    ====> dcos_installer.action_lib.prettyprint:: ====> END run_postflight with returncode: 0
    ====> dcos_installer.action_lib.prettyprint:: ====> SUMMARY
    ====> dcos_installer.action_lib.prettyprint:: 2 out of 2 hosts successfully completed run_postflight stage.
  • Step6:这个时候可以去页面上 http://<master-public-ip>:8181/exhibitor/v1/ui/index.html 看看 ZK 了

  • Step7:此时安装完成, 可以登录 DC/OS (http://<public-master-ip>/)的页面一睹芳容了。

posted @ 2016-06-24 15:28  chenqiangzhishen  阅读(456)  评论(0编辑  收藏  举报