ceph集群搭建

一、服务器规划

主机名	主机IP	磁盘配比	角色
node1	public-ip：10.0.0.130 cluster-ip:192.168.2.130	sda,sdb,sdc sda是系统盘，另外两块数据盘	ceph-deploy,monitor,mgr,osd
node2	public-ip：10.0.0.131 cluster-ip:192.168.2.131	sda,sdb,sdc sda是系统盘，另外两块数据盘	monitor,mgr,osd
node3	public-ip：10.0.0.132 cluster-ip:192.168.2.132	sda,sdb,sdc sda是系统盘，另外两块数据盘	monitor,mgr,osd

二、设置主机名

主机名设置，三台主机分别执行属于自己的命令

node1

[root@localhost ~]# hostnamectl set-hostname node1 [root@localhost ~]# hostname node1

node2

[root@localhost ~]# hostnamectl set-hostname node2 [root@localhost ~]# hostname node2

node3

[root@localhost ~]# hostnamectl set-hostname node3 [root@localhost ~]# hostname node3

执行完毕后要想看到效果，需要关闭当前命令行窗口，重新打开即可看到设置效果

三、设置hosts文件

在3台机器上都执行下面命令，添加映射

echo "10.0.0.130 node1 " >> /etc/hosts echo "10.0.0.131 node2 " >> /etc/hosts echo "10.0.0.132 node3 " >> /etc/hosts

四、创建用户并设置免密登录

创建用户（三台机器上都运行）

useradd -d /home/admin -m admin echo "123456" | passwd admin --stdin #sudo权限 echo "admin ALL = (root) NOPASSWD:ALL" | sudo tee /etc/sudoers.d/admin sudo chmod 0440 /etc/sudoers.d/admin

设置免密登录（只在node1上执行）

[root@node1 ~]# su - admin
[admin@node1 ~]$ ssh-keygen
Generating public/private rsa key pair.
Enter file in which to save the key (/home/admin/.ssh/id_rsa):
Created directory '/home/admin/.ssh'.
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /home/admin/.ssh/id_rsa.
Your public key has been saved in /home/admin/.ssh/id_rsa.pub.
The key fingerprint is:
SHA256:qfWhuboKeoHQOOMLOIB5tjK1RPjgw/Csl4r6A1FiJYA admin@admin.ops5.bbdops.com
The key's randomart image is:
+---[RSA 2048]----+
|+o..             |
|E.+              |
|*%               |
|X+X      .       |
|=@.+    S .      |
|X.*    o + .     |
|oBo.  . o .      |
|ooo.     .       |
|+o....oo.        |
+----[SHA256]-----+
[admin@node1 ~]$ ssh-copy-id admin@node1
[admin@node1 ~]$ ssh-copy-id admin@node2
[admin@node1 ~]$ ssh-copy-id admin@node3

五、配置时间同步

三台都执行

yum -y install ntpdate ntpdate -u cn.ntp.org.cn crontab -e */20 * * * * ntpdate -u cn.ntp.org.cn > /dev/null 2>&1 systemctl reload crond.service

5.1 关闭防火墙

六、安装ceph-deploy并安装ceph软件包

配置ceph清华源

cat > /etc/yum.repos.d/ceph.repo<<'EOF'

[Ceph]

name=Ceph packages for $basearch

baseurl=https://mirror.tuna.tsinghua.edu.cn/ceph/rpm-mimic/el7/$basearch

enabled=1

gpgcheck=1

type=rpm-md

gpgkey=https://mirror.tuna.tsinghua.edu.cn/ceph/keys/release.asc priority=1

[Ceph-noarch]

name=Ceph noarch packages

baseurl=https://mirror.tuna.tsinghua.edu.cn/ceph/rpm-mimic/el7/noarch

enabled=1

gpgcheck=1

type=rpm-md

gpgkey=https://mirror.tuna.tsinghua.edu.cn/ceph/keys/release.asc priority=1

[ceph-source]

name=Ceph source packages

baseurl=https://mirror.tuna.tsinghua.edu.cn/ceph/rpm-mimic/el7/SRPMS

enabled=1

gpgcheck=1

type=rpm-md

gpgkey=https://mirror.tuna.tsinghua.edu.cn/ceph/keys/release.asc priority=1

EOF

安装ceph-deploy

[root@node1 ~]# sudo yum install ceph-deploy

初始化mon点

ceph需要epel源的包，所以安装的节点都需要yum install epel-release

[admin@node1 ~]$ mkdir my-cluster

[admin@node1 ~]$ cd my-cluster # new

[admin@node1 my-cluster]$ ceph-deploy new node1 node2 node3

Traceback (most recent call last): File "/bin/ceph-deploy", line 18, in <module> from ceph_deploy.cli import main File "/usr/lib/python2.7/site-packages/ceph_deploy/cli.py", line 1, in <module> import pkg_resources ImportError: No module named pkg_resources

#以上出现报错，是因为没有pip，安装pip

[admin@node1 my-cluster]$ sudo yum install epel-release

[admin@node1 my-cluster]$ sudo yum install python-pip #重新初始化

[admin@node1 my-cluster]$ ceph-deploy new node1 node2 node3

[admin@node1 my-cluster]$ ls ceph.conf ceph-deploy-ceph.log ceph.mon.keyring

[admin@node1 my-cluster]$ cat ceph.conf

[global] fsid = a1132f78-cdc5-43d0-9ead-5b590c60c53d mon_initial_members = node1, node2, node3 mon_host = 10.28.103.211,10.28.103.212,10.28.103.213 auth_cluster_required = cephx auth_service_required = cephx auth_client_required = cephx

修改ceph.conf，添加如下配置

public network = 10.28.103.0/24

cluster network = 172.30.103.0/24

osd pool default size = 3

osd pool default min size = 2

osd pool default pg num = 128

osd pool default pgp num = 128

osd pool default crush rule = 0

osd crush chooseleaf type = 1

max open files = 131072

ms bind ipv6 = false

[mon]

mon clock drift allowed = 10

mon clock drift warn backoff = 30

mon osd full ratio = .95

mon osd nearfull ratio = .85

mon osd down out interval = 600

mon osd report timeout = 300

mon allow pool delete = true

[osd]

osd recovery max active = 3

osd max backfills = 5

osd max scrubs = 2

osd mkfs type = xfs

osd mkfs options xfs = -f -i size=1024

osd mount options xfs = rw,noatime,inode64,logbsize=256k,delaylog

filestore max sync interval = 5

osd op threads = 2

安装Ceph软件到指定节点

[admin@node1 my-cluster]$ ceph-deploy install --no-adjust-repos node1 node2 node3

--no-adjust-repos是直接使用本地源，不生成官方源。

部署初始的monitors，并获得keys

[admin@node1 my-cluster]$ ceph-deploy mon create-initial

#添加mon节点使其高可用
ceph-deploy --overwrite mon add node-2
ceph-deploy --overwrite mon add node-3

做完这一步，在当前目录下就会看到有如下的keyrings：

[admin@node1 my-cluster]$ ls

ceph.bootstrap-mds.keyring ceph.bootstrap-osd.keyring ceph.client.admin.keyring ceph-deploy-ceph.log ceph.bootstrap-mgr.keyring ceph.bootstrap-rgw.keyring ceph.conf ceph.mon.keyring

将配置文件和密钥复制到集群各节点

配置文件就是生成的ceph.conf，而密钥是ceph.client.admin.keyring，当使用ceph客户端连接至ceph集群时需要使用的密默认密钥，这里我们所有节点都要复制，命令如下。

[admin@node1 my-cluster]$ ceph-deploy admin node1 node2 node3

七、部署ceph-mgr

#在L版本的`Ceph`中新增了`manager daemon`，如下命令部署一个`Manager`守护进程

[admin@node1 my-cluster]$ ceph-deploy mgr create node1

添加mgr，实现高可用

                       ceph-deploy mgr create node2 node3

八、创建osd

在node1上执行以下命令

#用法：

ceph-deploy osd create –data {device} {ceph-node}

ceph-deploy osd create --data /dev/sdb node1

ceph-deploy osd create --data /dev/sdb node2

ceph-deploy osd create --data /dev/sdb node3

ceph-deploy osd create --data /dev/sdc node1

ceph-deploy osd create --data /dev/sdc node2

ceph-deploy osd create --data /dev/sdc node3

如果报错，记得用root执行

检查osd状态

[admin@node1 ~]$ sudo ceph health HEALTH_OK

[admin@node1 ~]$ sudo ceph -s

cluster: id: af6bf549-45be-419c-92a4-8797c9a36ee8 health: HEALTH_OK services: mon: 3 daemons, quorum node1,node2,node3 mgr: node1(active) osd: 6 osds: 6 up, 6 in data: pools: 0 pools, 0 pgs objects: 0 objects, 0 B usage: 6.0 GiB used, 108 GiB / 114 GiB avail pgs:

默认情况下ceph.client.admin.keyring文件的权限为600，属主和属组为root，如果在集群内节点使用cephadmin用户直接直接ceph命令，将会提示无法找到/etc/ceph/ceph.client.admin.keyring文件，因为权限不足。

如果使用sudo ceph不存在此问题，为方便直接使用ceph命令，可将权限设置为644。在集群节点上面node1 admin用户下执行下面命令。

[admin@node1 my-cluster]$ ceph -s

2020-03-08 07:59:36.062 7f52d08e0700 -1 auth: unable to find a keyring on /etc/ceph/ceph.client.admin.keyring,/etc/ceph/ceph.keyring,/etc/ceph/keyring,/etc/ceph/keyring.bin,:

(2) No such file or directory 2020-03-08 07:59:36.062 7f52d08e0700 -1 monclient: ERROR: missing keyring, cannot use cephx for authentication [errno 2] error connecting to the cluster [admin@node1 my-cluster]$ sudo chmod 644 /etc/ceph/ceph.client.admin.keyring [admin@node1 my-cluster]$ ceph -s cluster: id: af6bf549-45be-419c-92a4-8797c9a36ee8 health: HEALTH_OK services: mon: 3 daemons, quorum node1,node2,node3 mgr: node1(active) osd: 6 osds: 6 up, 6 in data: pools: 0 pools, 0 pgs objects: 0 objects, 0 B usage: 6.1 GiB used, 108 GiB / 114 GiB avail pgs: [admin@node1 my-cluster]$

查看osds

[admin@node1 ~]$ sudo ceph osd tree

ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF -1 0.11151 root default -3 0.03717 host node1 0 hdd 0.01859 osd.0 up 1.00000 1.00000 3 hdd 0.01859 osd.3 up 1.00000 1.00000 -5 0.03717 host node2 1 hdd 0.01859 osd.1 up 1.00000 1.00000 4 hdd 0.01859 osd.4 up 1.00000 1.00000 -7 0.03717 host node3 2 hdd 0.01859 osd.2 up 1.00000 1.00000 5 hdd 0.01859 osd.5 up 1.00000 1.00000

九、开启MGR监控模块

方式一：命令操作

ceph mgr module enable dashboard

如果以上操作报错如下：

Error ENOENT: all mgr daemons do not support module 'dashboard', pass --force to force enablement

则因为没有安装ceph-mgr-dashboard，在mgr的节点上安装。

yum install ceph-mgr-dashboard

方式二：配置文件

# 编辑ceph.conf文件

vi ceph.conf

[mon]

mgr initial modules = dashboard

#推送配置

[admin@admin my-cluster]$ ceph-deploy --overwrite-conf config push node1 node2 node3

#重启mgr

sudo systemctl restart ceph-mgr@node1

web登录配置

默认情况下，仪表板的所有HTTP连接均使用SSL/TLS进行保护。

#要快速启动并运行仪表板，可以使用以下内置命令生成并安装自签名证书:

[root@node1 my-cluster]# ceph dashboard create-self-signed-cert Self-signed certificate created

#创建具有管理员角色的用户:

[root@node1 my-cluster]# ceph dashboard set-login-credentials admin admin Username and password updated

#查看ceph-mgr服务:

[root@node1 my-cluster]# ceph mgr services { "dashboard": "https://node1:8443/" }

以上配置完成后，浏览器输入https://node1:8443输入用户名admin，密码admin登录即可查看

参考链接：

https://www.sysit.cn/blog/post/sysit/Ceph%E5%AE%89%E8%A3%85%E9%85%8D%E7%BD%AE%E6%89%8B%E5%86%8C

https://boke.wsfnk.com/archives/1163.html

https://www.linux-note.cn/?p=85

ceph集群搭建成功后进行格式化挂载使用参考地址

http://www.soolco.com/post/89854_1_1.html

ceph集群搭建完成，使用存储进行如下操作：

3.2 添加元数据服务(MDS)

要使用 Ceph 的文件存储--CephFS，需要至少需要创建一个元数据服务(METADATA SERVER)

ceph-deploy mds create ceph-admin-node1

METADATA SERVER (mds)会按序监听68xx可用端口

[myceph@ceph-admin-node1 my-cluster]$ sudo ss -lntp | grep "ceph-mds"
LISTEN     0      128    192.168.1.51:6810                     *:*                   users:(("ceph-mds",pid=19337,fd=17))
LISTEN     0      128    192.168.1.51:6811                     *:*                   users:(("ceph-mds",pid=19337,fd=18))

3.3 添加对象网关组件(RGW)

RGW 是 Ceph 的 S3/Swift 网关组件。要使用 Ceph 的对象存储，必须安装 RGW

ceph-deploy rgw create ceph-admin-node1

RGW 默认监听 7480 端口

[myceph@ceph-admin-node1 my-cluster]$ sudo ss -lntp | grep 7480
LISTEN     0      128          *:7480                     *:*                   users:(("radosgw",pid=19444,fd=45))

检查，如果启动成功，访问此端口会有如下回显

[myceph@ceph-admin-node1 my-cluster]$ curl http://ceph-admin-node1:7480
<?xml version="1.0" encoding="UTF-8"?><ListAllMyBucketsResult xmlns="http://s3.amazonaws.com/doc/2006-03-01/"><Owner><ID>anonymous</ID><DisplayName></DisplayName></Owner><Buckets></Buckets></ListAllMyBucketsResult>

可选：如要修改端口，可以修改配置文件ceph.conf，如改为80端口

[client.rgw.client-node]
rgw_frontends = "civetweb port=80"

需要重启

sudo systemctl restart ceph-radosgw.service

4. 客户端安装

想用使用 Ceph ，那么服务器节点需要安装 Ceph 客户端 (确保已经创建部署用户，如我上面创建的: myceph)

ceph-deploy install ceph-client --repo-url https://mirrors.aliyun.com/ceph/rpm-nautilus/el7 --gpg-url https://mirrors.aliyun.com/ceph/keys/release.asc
ceph-deploy admin ceph-client

5. 块存储操作

5.1 创建 pool

管理节点上操作

如有需要，参阅附1官方链接

创建池创建一个名为rbd的池，且pg_num为 8

sudo ceph osd pool create rbd 8

5.1.1 pool的常用操作

附上一些pool的常用操作查看所有池

sudo ceph osd lspools

删除池需要修改配置文件ceph.conf，将 mon_allow_pool_delete 设置为 true。

sudo ceph osd pool delete rbd rbd --yes-i-really-really-mean-it

5.2 初始化 pool

管理节点上操作

sudo rbd pool init rbd

5.3 创建块设备镜像

客户端操作创建大小为4G的设备镜像

sudo rbd create foo --size 4096 --image-feature layering -p rbd

列出块设备镜像

sudo rbd ls

5.4 设备镜像映射块设备

客户端操作

sudo rbd map foo --name client.admin -p rbd

执行成功，会回显块设备的目录地址，如下

/dev/rbd0

5.5 挂载

客户端操作

mkfs.xfs /dev/rbd0
mkdir -p /cephblock
mount /dev/rbd0 /cephblock

查看结果

[myceph@ceph-client ~]$ df -h
Filesystem      Size  Used Avail Use% Mounted on
/dev/sda3        48G  1.9G   46G   4% /
devtmpfs        983M     0  983M   0% /dev
tmpfs           993M     0  993M   0% /dev/shm
tmpfs           993M  8.6M  984M   1% /run
tmpfs           993M     0  993M   0% /sys/fs/cgroup
/dev/sda1       497M  113M  385M  23% /boot
tmpfs           199M     0  199M   0% /run/user/0
/dev/rbd0       4.0G   33M  4.0G   1% /cephblock  # 挂载成功

5.6 扩容/缩容

客户端操作扩容/缩容的本质就是调整设备镜像大小

sudo rbd resize --size 8192 foo # 扩容至8G
sudo rbd resize --size 2048 foo --allow-shrink # 减少至2G

然后使用扩展工具刷新生效

sudo xfs_growfs /dev/rbd0  # xfs文件系统格式使用xfs_growfs，其它ext4等使用resize2fs

查看结果 (这里我只进行了扩容，xfs只能扩容，ext4等可以扩缩)

[myceph@ceph-client ~]$ df -h
Filesystem      Size  Used Avail Use% Mounted on
/dev/sda3        48G  1.9G   46G   4% /
devtmpfs        983M     0  983M   0% /dev
tmpfs           993M     0  993M   0% /dev/shm
tmpfs           993M  8.6M  984M   1% /run
tmpfs           993M     0  993M   0% /sys/fs/cgroup
/dev/sda1       497M  113M  385M  23% /boot
tmpfs           199M     0  199M   0% /run/user/0
/dev/rbd0       8.0G   33M  8.0G   1% /cephblock  # 扩容成功

6. 文件存储操作

Ceph文件系统（CephFS）是一个符合POSIX标准的文件系统，它使用Ceph存储集群来存储其数据。Ceph文件系统使用与Ceph块设备相同的Ceph存储集群系统，带有S3和Swift API的Ceph对象存储或本机绑定（librados）。

6.1 创建 pool

管理节点操作和块存储类似，也需要创建池，但是不同的是，文件存储创建的池是默认池，而且还是两个，分别是cephfs_data和cephfs_metadata

sudo ceph osd pool create cephfs_data 8
sudo ceph osd pool create cephfs_metadata 8

6.2 创建文件系统 (CephFS)

管理节点操作

sudo ceph fs new mycephfs cephfs_metadata cephfs_data

6.3 创建认证文件

客户端操作创建认证文件admin.secret

key=`sudo awk -F " = " '/key/{print $2}' /etc/ceph/ceph.client.admin.keyring`  # 获取key
sudo /bin/bash -c "echo $key > /etc/ceph/admin.secret"

6.4 挂载 CephFS

sudo mkdir -p /cephfs
sudo mount -t ceph 192.168.1.51:6789:/ /cephfs -o name=admin,secretfile=/etc/ceph/admin.secret

查看结果

[myceph@ceph-client ~]$ df -h
Filesystem           Size  Used Avail Use% Mounted on
/dev/sda3             48G  1.9G   46G   4% /
devtmpfs             983M     0  983M   0% /dev
tmpfs                993M     0  993M   0% /dev/shm
tmpfs                993M  8.6M  984M   1% /run
tmpfs                993M     0  993M   0% /sys/fs/cgroup
/dev/sda1            497M  113M  385M  23% /boot
tmpfs                199M     0  199M   0% /run/user/0
/dev/rbd0            8.0G   33M  8.0G   1% /cephblock
192.168.1.51:6789:/   27G  3.1G   24G  12% /cephfs  # 挂载成功

7. 对象存储操作

深入了解移步官方，目前这部分我也是云里雾里

7.1 创建用户

管理节点操作创建 S3 用户

sudo radosgw-admin user create --uid=myobjstor --display-name="小明" --email=myobjstor@example.com

创建 Swift 子用户 (必须先创建S3用户才能创建Swift用户)

sudo radosgw-admin subuser create --uid=myobjstor --subuser=myobjstor:swift --access=full

获取用户信息

sudo radosgw-admin user info --uid=myobjstor

回显用户信息，注意 swift 部分，如下

"swift_keys": [
    {
        "user": "myobjstor:swift",
        "secret_key": "CHu60IKc2v3Rsjm1PLA7rpv1UY4Cf9Vk6LsOIP8B"
    }
],

7.2 Python操作Swift

需要安装包python-swiftclient

pip3 install python-swiftclient

代码如下

import swiftclient

user = 'johndoe:swift'
key = 'cxAXmdXtEgTNXN42Kg8krBunDGS6MAtNQbW8R1t6'

# 连接 Swift
conn = swiftclient.Connection(
        user=user,
        key=key,
        authurl='http://192.168.1.51:7480/auth',
)

# 创建容器
container_name = 'my-new-container'
conn.put_container(container_name)

# 创建对象
with open('hello.txt', 'r') as hello_file:
    conn.put_object(container_name, 'hello.txt',
                    contents=hello_file.read(),
                    content_type='text/plain')

# 获取所有容器
for container in conn.get_account()[1]:
        print(container['name'])

# 获取指定容器的所有对象列表
for data in conn.get_container(container_name)[1]:
        print('{0}\t{1}\t{2}'.format(data['name'], data['bytes'], data['last_modified']))

# 检索对象(下载) -- 将 hello.txt 下载并重命名为 my_hello.txt
obj_tuple = conn.get_object(container_name, 'hello.txt')
with open('my_hello.txt', 'wb') as my_hello:
        my_hello.write(obj_tuple[1])

获取所有容器回显

my-new-container

获取指定容器中的所有对象列表回显

hello.txt    11    2019-07-17T09:12:31.708Z






参考地址：   https://www.flylinux.com/


             http://docs.ceph.org.cn/rados/                 ceph官方指导
          
           http://www.soolco.com/post/89854_1_1.html

posted @ 2021-03-09 19:45 woaibaobei 阅读(185) 评论(0) 编辑收藏举报

刷新页面返回顶部

ceph集群搭建

一、服务器规划

二、设置主机名

三、设置hosts文件

四、创建用户并设置免密登录

五、配置时间同步

六、安装ceph-deploy并安装ceph软件包

配置ceph清华源

安装ceph-deploy

初始化mon点

安装Ceph软件到指定节点

七、部署ceph-mgr

八、创建osd

检查osd状态

查看osds

九、开启MGR监控模块

方式一：命令操作

方式二：配置文件

web登录配置

3.2 添加元数据服务(MDS)

3.3 添加对象网关组件(RGW)

4. 客户端安装

5. 块存储操作

5.1 创建 pool

5.1.1 pool的常用操作

5.2 初始化 pool

5.3 创建块设备镜像

5.4 设备镜像映射块设备

5.5 挂载

5.6 扩容/缩容

6. 文件存储操作

6.1 创建 pool

6.2 创建文件系统 (CephFS)

6.3 创建认证文件

6.4 挂载 CephFS

7. 对象存储操作

7.1 创建用户

7.2 Python操作Swift

公告