深入理解 DeepSea 和 Salt 部署工具 - Storage6

学习 SUSE Storage 系列文章

首先我们通过前几篇文章，已经搭建了一套完整的Ceph集群，对使用salt工具自动化搭建集群有所了解，下面我们就对部署方式进行详解

SUSE Enterprise Storage 部署方式

storage4 采用的方式：

ceph-deploy 工具，标准的ceph脚本部署，适用于中小型存储集群
crowbar工具，部署SUSE Openstack的标准工具

storage5/6 采用方式：

DeepSea (Salt)，轻量级，敏捷性，灵活性，弹性部署

过去我们的部署方式采用社区的方式ceph-deploy或 crowbar 工具搭建，这2种工具部署都有一定局限性，不适合大型存储集群部署，敏捷性、灵活性太差。因此从2018年开始，SUSE Enterprise Storage 5 弃用 ceph-deploy / crowbar 群集部署工具 ,推出DeepSea方式进行部署，该方式更加轻量级，高速互通，敏捷性，灵活性，适用于各种场景部署集群系统，也是Ceph产品部署方式的趋势。

一、DeepSea 简介

DeepSea 旨在节省管理员的时间，让他们自信地对 Ceph 群集执行复杂操作。Ceph 是一款高度可配置的软件解决方案。它提高了系统管理员的自由度和职责履行能力。最低的 Ceph 设置能够很好地满足演示目的，但无法展示 Ceph 在处理大量节点时可体现的卓越功能。DeepSea 会收集并储存有关单台服务器的相关数据，例如地址和设备名称。对于诸如 Ceph 的分布式储存系统，可能需要收集并储存数百个这样的项目。收集信息并手动将数据输入到配置管理工具的过程非常耗费精力，并且容易出错。准备服务器、收集配置信息以及配置和部署 Ceph 所需执行的步骤大致相同。但是，这种做法无法解决管理独立功能的需求。在日常操作中，必须做到不厌其烦地将硬件添加到给定的功能，以及从容地去除硬件。DeepSea 通过以下策略解决了这些需求：DeepSea 可将管理员的多项决策合并到单个文件中。这些决策包括群集指派、角色指派和配置文件指派。此外，DeepSea 会收集各组任务以组成一个简单的目标。每个目标就是一个阶段：

关于DeepSea官方资料：

GitHub 链接： https://github.com/SUSE/DeepSea/wiki

二、SaltStack 简介

SaltStack 是一个服务器基础架构集中化管理平台，具备配置管理、远程执行、监控等功能，一般可以理解为简化版的puppet和加强版的func。SaltStack 基于Python语言实现，结合轻量级消息队列（ZeroMQ）与Python第三方模块（Pyzmq、PyCrypto、Pyjinjia2、 python-msgpack和PyYAML等）构建。

通过部署SaltStack环境，我们可以在成千上万台服务器上做到批量执行命令，根据不同业务特性进行配置集中化管理、分发文件、采集服务器数据、操作系统基础及软件包管理等，SaltStack是运维人员提高工作效率、规范业务配置与操作的利器。

特性：

（1）部署简单、方便；

（2）支持大部分UNIX/Linux及Windows环境；

（3）主从集中化管理；

（4）配置简单、功能强大、扩展性强；

（5）主控端（master）和被控端（minion）基于证书认证，安全可靠；

（6）支持API及自定义模块，可通过Python轻松扩展。

SaltStack: Pillar 和 Grains 详解

SatlStack 远程执行

1、远程执行

目标（Targeting）
模块（Module）
返回（return）

2、目标

（1）和Minion ID 有关，需要使用Minion ID

通配符
正则表达式
列表

通配符方式：

# salt 'node00[1-3]'.example.com cmd.run 'w'
node002.example.com:
     13:06:12 up  4:05,  0 users,  load average: 0.28, 0.09, 0.02
    USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
node001.example.com:
     13:06:12 up  4:05,  0 users,  load average: 0.23, 0.13, 0.05
    USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
node003.example.com:
     13:06:12 up  4:05,  0 users,  load average: 0.24, 0.09, 0.02
    USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT

正则表达式

# salt -E 'node(001|002).example.com' test.ping        
node002.example.com:
    True
node001.example.com:
    True

（2）和Minion ID 无关，不涉及到Minion ID

子网 / IP 地址
Grains
Pillar
Compound matchers (复合匹配)
Node groups (节点组)
Batching execution （批处理执行）

Grains 方式，OS是SUSE

# salt -G 'os:SUSE' test.ping 
node001.example.com:
    True
node002.example.com:
    True
node003.example.com:
    True
node004.example.com:
    True
admin.example.com:
    True

获取 Pillar ，然后指定pillar方式

# salt 'admin*' pillar.items 
admin.example.com:
    ----------
    available_roles:
        - storage
        - admin
        - mon
        - mds
        - mgr

     .....

    roles:
        - master
        - admin
        - prometheus
        - grafana
    time_server:
        admin.example.com

# salt -I 'roles:grafana' test.ping             
admin.example.com:
    True

3、模块详解

1000+ 的模块，目前在不断增加中， saltstack模块链接

admin:~ # salt 'node001*' network.arp  
node001.example.com:
    ----------
    00:0c:29:33:70:2d:
        192.168.2.42
    00:0c:29:33:70:37:
        192.168.3.42
    00:0c:29:ae:44:51:
        172.200.50.39
    00:0c:29:ae:44:5b:
        192.168.2.39
    00:0c:29:d3:ba:15:
        192.168.2.41
    00:0c:29:d3:ba:1f:
        192.168.3.41
    00:0c:29:e0:5c:8c:
        192.168.2.43
    00:0c:29:e0:5c:96:
        192.168.3.43

admin:~ # salt 'node001*' network.interface eth1 
node001.example.com:
    |_
      ----------
      address:
          192.168.2.40
      broadcast:
          192.168.2.255
      label:
          eth1
      netmask:
          255.255.255.0

三、配置和自定义

policy.cfg 文件

/srv/pillar/ceph/proposals/policy.cfg 配置文件用于确定单个群集节点的角色。例如，哪个节点充当 OSD，或哪个节点充当监视器节点。请编辑 policy.cfg ，以反映所需的群集设置。段落采用任意顺序，但所包含行的内容将重写前面行的内容中匹配的密钥。

1、policy.cfg 的模板

可以在 /usr/share/doc/packages/deepsea/examples/ 目录中找到完整策略文件的多个示例。

一般我们选择基于角色定义的模板

# ll /usr/share/doc/packages/deepsea/examples/
total 12
-rw-r--r-- 1 root root 329 Aug  9 16:00 policy.cfg-generic
-rw-r--r-- 1 root root 489 Aug  9 16:00 policy.cfg-regex
-rw-r--r-- 1 root root 577 Aug  9 16:00 policy.cfg-rolebased

2、群集指派

要包含所有受控端，请添加以下几行：

cluster-ceph/cluster/*.sls

要将特定的受控端加入白名单，请运行以下命令：

cluster-ceph/cluster/abc.domain.sls

要将一组受控端加入白名单，可以使用通配符：

cluster-ceph/cluster/mon*.sls

要将受控端加入黑名单，可将其设置为 unassigned ：

cluster-unassigned/cluster/client*.sls

3、policy.cfg 示例

下面是一个基本 policy.cfg 文件的示例：

 1 vim /srv/pillar/ceph/proposals/policy.cfg 
 2 
 3 ## Cluster Assignment
 4 cluster-ceph/cluster/*.sls
 5 
 6 ## Roles
 7 # ADMIN
 8 role-master/cluster/admin*.sls
 9 role-admin/cluster/admin*.sls
10 
11 # Monitoring
12 role-prometheus/cluster/admin*.sls
13 role-grafana/cluster/admin*.sls
14 
15 # MON
16 role-mon/cluster/node00[1-3]*.sls
17 
18 # MGR (mgrs are usually colocated with mons)
19 role-mgr/cluster/node00[1-3]*.sls
20 
21 # COMMON
22 config/stack/default/global.yml
23 config/stack/default/ceph/cluster.yml
24 
25 # Storage
26 role-storage/cluster/node00*.sls
27 
28 # MDS
29 role-mds/cluster/node001*.sls
30 
31 # IGW
32 role-igw/stack/default/ceph/minions/node002*.yml
33 role-igw/cluster/node002*.sls
34 
35 # RGW
36 role-rgw/cluster/node00[3-4]*.sls

（1）第3-4行：

指示在 Ceph 群集中包含所有受控端。如果您不想在 Ceph 群集中包含某些受控端，请使用：

cluster-unassigned/cluster/*.sls
cluster-ceph/cluster/node00*.sls

将所有受控端标记为未指派。
覆盖与“node00*.sls”匹配的受控端，并将其指派到 Ceph 群集。

（2）第7-9行

指定主机名为admin的主机节点具有"master" 和 “admin” 角色

（3）第11-13行

指定要部署 Dashboard 可视化界面的节点

（4）第15-16行

将受控节点 node001 node002 node003 设置为MON 节点

（5）第18-19

将受控节点 node001 node002 node003 设置为 MGR 节点，该设置必须跟随 MON 设置一样

（6）第21-23行

表示接受 fsid 和 public_network 等通用配置参数的默认值

（7）第25-36行

受控端 “node00*” 将具有 storage IGW RGW MDS 角色

四、DeepSea 部署方式

通过架构图，我们可以清楚的了解到，安装 Storage6 时只要管理节点安装 satl-master 和 salt-minion，其他OSD节点安装 salt-minion，并且所有的 minion 都指向salt-master IP地址或主机名（推荐使用public网段地址），然后执行deepsea 的4个阶段命令 “salt-run state.orch ceph.stage.X” 就可以轻松的搭建完成。

DeepSea阶段说明

阶段 0 — 准备：在此阶段，将应用全部所需的更新，并且可能会重引导您的系统。

阶段 1 — 发现：在此阶段，通过Salt在客户端安装的salt minion, 将检测群集中的所有硬件, 并收集 Ceph 配置所需的信息。

阶段 2 — 配置：您需要以特定的格式准备配置数据。（定义 salt 的pillar）

阶段 3 — 部署：创建包含必要 Ceph 服务的基本 Ceph 群集。有关必要服务的列表

阶段 4 — 服务：可在此阶段安装 Ceph 的其他功能，例如 iSCSI、RADOS 网关和CephFS。其中每个功能都是可选的。

阶段 5 — 去除阶段：此阶段不是必需的，在初始设置期间，通常不需要此阶段。在此阶段，将会去除受控端的角色以及群集配置。如果您需要从群集中去除某个储存节点，则需要运行此阶段.

DeepSea CLI

DeepSea 还提供了一个 CLI 工具，供用户监视或运行阶段，同时实时将执行进度可视化。支持使用以下两种模式来可视化阶段的执行进度：

监视模式：可视化另一个终端会话中发出的 salt-run 命令所触发 DeepSea 阶段的执行进度。
独立模式：运行 DeepSea 阶段，并在该阶段的构成步骤执行时提供相应的实时可视化效果。

监控模式 Monitor Mode

该程序监控提供一个详细的，实时的可视化操作行为，当在执行运行salt-run state.orch时，监控执行期间运行了什么

# deepsea monitor

独立模式 Stand-alone Mode

# deepsea stage run stage-name
# salt-run state.orch ceph.stage.0
# deepsea stage run ceph.stage.0

Deepsea帮助信息

# man deepsea-monitor
NAME
deepsea-monitor - Starts the DeepSea stage execution progress monitor.
# man deepsea-stage run

posted @ 2019-09-23 13:16 阿尔菲阅读(1343) 评论(0) 编辑收藏举报

刷新页面返回顶部

阿尔菲