03 2022 档案

摘要:配置合理的监控和告警规则对于安全、可靠地运行生产工作负载至关重要。在使用 Kubernetes 和 Rancher 时也是如此。幸运的是,集成的监控和告警功能使整个过程变得更加简单。 Rancher 的监控文档( https://docs.rancher.cn/docs/rancher2.5/mon 阅读全文
posted @ 2022-03-14 13:56 Varden 编辑
摘要:在本指南中,我们推荐了集群级别日志记录和应用日志记录的最佳实践。 Rancher v2.5 中日志记录的变化 集群级别日志 应用程序日志 通用最佳实践 Rancher v2.5 中日志记录的变化 在 Rancher v2.5 之前,Rancher 中的日志记录是一个静态集成。有一个固定的聚合器列表可 阅读全文
posted @ 2022-03-14 10:26 Varden 编辑
摘要:如果遇到灾难情况,您可以将 Rancher Server 恢复到最新的备份。 在开始之前 在还原备份期间,您将输入一系列命令,用环境中的数据填充占位符。这些占位符用斜括号和所有大写字母 (<EXAMPLE>) 表示。下面是一个带有占位符的命令的例子: docker run --volumes-fro 阅读全文
posted @ 2022-03-13 17:09 Varden 编辑
摘要:成功安装基于 Docker 的 Rancher 后,我们建议定期为其创建备份。拥有最近的备份将让您从意外灾难中快速恢复。 在开始之前 在创建备份期间,您将输入一系列命令,用环境中的数据替换占位符。这些占位符用斜括号和所有大写字母 (<EXAMPLE>) 表示。下面是一个带有占位符的命令的例子: do 阅读全文
posted @ 2022-03-13 16:49 Varden 编辑
摘要:本节包含 Backup 和 Restore 自定义资源的示例。 默认的备份存储位置是在安装或升级rancher-backup operator 时配置的。 只有 Restore 自定义资源使用与创建备份相同的加密配置 secret 时,才能还原加密的备份。 备份 本节包含 Backup 自定义资源的 阅读全文
posted @ 2022-03-13 16:41 Varden 编辑
摘要:配置一个默认保存所有备份的存储位置。您可以选择对每个备份进行覆盖,但仅限于使用与 S3 兼容的对象存储。在 operator 级别只能配置一个存储位置。 配置存储位置 无默认存储位置 您可以选择不配置任何 operator 级别存储位置。如果选择此选项,您必须配置一个与 S3 兼容的对象存储作为每个 阅读全文
posted @ 2022-03-13 16:30 Varden 编辑
摘要:本页面提供还原备份的详细信息。 备份源 提供备份文件和备份文件存储位置的详细信息,operator 使用这个文件执行还原。从以下选项中选择这些详细信息。 现有的备份配置 选择该选项将在目标备份下拉菜单中填充该集群中可用的备份。从下拉菜单中选择备份,自动为您填写备份文件名字段,还将把所选 Backup 阅读全文
posted @ 2022-03-13 16:22 Varden 编辑
摘要:通过 Backup Create 页面,您可以配置计划、启用加密和指定备份的存储位置。 定时调度 选择第一个选项可执行一次性备份,或选择第二个选项可安排定期备份。选择定期备份可让您配置以下两个字段: 定时调度: 该字段接受 标准 cron 表达式, 如 "0 * * * *" 描述符,如 "@mid 阅读全文
posted @ 2022-03-13 16:12 Varden 编辑
摘要:如果你要将 Rancher 迁移到一个新的 Kubernetes 集群,你不需要先在新集群上安装 Rancher。如果将 Rancher 还原到一个已经安装了 Rancher 的新集群上,可能会引起问题。 先决条件 这些说明假设你已经创建了一个备份,并且已经安装了将在其中部署 Rancher 的新 阅读全文
posted @ 2022-03-13 14:43 Varden 编辑
摘要:请按照以下步骤恢复 Rancher。 重要 请按照此页面上的说明在已备份的同一集群上恢复 rancher。为了将 rancher 迁移到新的集群,请按照步骤进行迁移 rancher( https://docs.rancher.cn/docs/rancher2.5/backups/migrating- 阅读全文
posted @ 2022-03-13 14:27 Varden 编辑
摘要:在本文中,你将学习如何备份运行在任何 Kubernetes 集群上的 Rancher。 backup-restore operator 需要安装在 local 集群中,并且只备份 Rancher 应用。备份和恢复操作只在 local Kubernetes 集群中执行。 请注意,1.x.x 版本的 r 阅读全文
posted @ 2022-03-13 14:09 Varden 编辑
摘要:本指南面向的是使用 Rancher 管理下游 Kubernetes 集群的用例。高可用设置可以防止在 Rancher Server 不可用时失去对下游集群的访问。 高可用 Rancher 安装,定义为在至少有三个节点的 Kubernetes 集群上安装 Rancher,应该适用于 Rancher 的 阅读全文
posted @ 2022-03-13 13:55 Varden 编辑
摘要:概述 Rancher 使用 cert-manager 为 Rancher 高可用部署自动生成和更新 TLS 证书。从 2019 秋季开始,cert-manager 发生了三个重要的变化,如果你在此时间段前创建了 Rancher 高可用部署,您需要采取以下措施: 从 2019 年 11 月 1 日开始 阅读全文
posted @ 2022-03-13 11:22 Varden 编辑
摘要:回滚到 Rancher v2.5.0+ 要回滚到 Rancher v2.5.0+,请使用 Rancher Backups 应用程序并从备份中恢复 Rancher。 回滚后,Rancher 必须以较低/以前的版本启动。 通过创建 Restore 自定义资源进行还原。 重要: 请按照此页面上的说明在已备 阅读全文
posted @ 2022-03-13 10:27 Varden 编辑
摘要:1. 前提条件 1.1 访问 kubeconfig 的权限 Helm 应该从与你的 kubeconfig 文件相同的位置运行,或者从你运行 kubectl 命令的相同位置运行。 如果你在安装 Kubernetes 时使用了 RKE,那么将在你运行 rke up 的目录下创建 kubeconfig 文 阅读全文
posted @ 2022-03-13 10:11 Varden 编辑
摘要:Java和Docker不是天然的朋友(Java诞生比Docker早得多)。 Docker可以设置内存和CPU限制,而Java不能自动检测到。使用Java的Xmx标识(繁琐/重复,仍然会多用内存)或新的实验性JVM标识,我们可以解决这个问题。 1. 自动设置(推荐):如果你想要的是,不显式的指定-Xm 阅读全文
posted @ 2022-03-13 09:03 Varden 编辑
摘要:通用选项 高级选项 API 审计日志 启用 API 审计日志。 你可以像收集任何容器日志一样收集此日志。为 Rancher Server 集群上的 System 项目启用日志。 --set auditLog.level=1 **默认情况下,启用审计日志将在 Rancher pod 中创建一个 sid 阅读全文
posted @ 2022-03-12 16:39 Varden 编辑
摘要:1. 配置基础设施和私有镜像仓库 从 Rancher v2.5 开始,Rancher 可以安装在任何 Kubernetes 集群上。 1.1 RKE 高可用集群 在 RKE 集群中安装 Rancher 高可用,我们建议为高可用安装配置以下基础设施: 3 个 Linux 节点,通常是虚拟机,您可以自行 阅读全文
posted @ 2022-03-12 16:03 Varden 编辑
摘要:先决条件 Kubernetes 集群 设置 Rancher Server 的本地 Kubernetes 集群。Rancher 可以安装在任何 Kubernetes 集群上。这个集群可以使用上游 Kubernetes,也可以使用 Rancher 的 Kubernetes 发行版之一,也可以是来自 Am 阅读全文
posted @ 2022-03-12 10:21 Varden 编辑
摘要:最小文件示例 nodes: - address: 1.2.3.4 user: ubuntu role: - controlplane - etcd - worker 完整文件示例 nodes: # 节点选项配置 - address: 1.1.1.1 # 用于设置节点的主机名或 IP 地址。RKE 必 阅读全文
posted @ 2022-03-11 10:02 Varden 编辑
摘要:SSH 连接报错 Failed to set up SSH tunneling for host [xxx.xxx.xxx.xxx]: Can't retrieve Docker Info Failed to dial to /var/run/docker.sock: ssh: rejected: 阅读全文
posted @ 2022-03-11 09:57 Varden 编辑
摘要:概述 v0.1.7 或以上版本可用 RKE 集群可以自动备份 etcd 节点的快照。在灾难场景下,您可以使用这些快照恢复集群。RKE 将快照保存本地/opt/rke/etcd-snapshots路径下。 v0.2.0 或以上版本可用 RKE 可将集群快照上传至 AWS S3 适配的后端机器。 说明: 阅读全文
posted @ 2022-03-11 09:31 Varden 编辑
摘要:与 Kubernetes 集群通信前,您需要在本地机器中下载和安装kubectl文件,请单击此处( https://kubernetes.io/docs/tasks/tools/install-kubectl/ )下载kubectl。 kubeconfig 文件,即 kubeconfig file, 阅读全文
posted @ 2022-03-11 08:13 Varden 编辑
摘要:配置最大不可用节点数量 升级集群前,您可以编辑cluster.yml文件对应的参数,调整最大不可用节点的数量。 max_unavailable_controlplane: 升级集群时,RKE 可以容忍的无响应 controlplane 节点数量,默认值为 1,表示如果有 1 个节点在升级 RK 集群 阅读全文
posted @ 2022-03-10 22:30 Varden 编辑
摘要:v1.1.0 开始可用 概述 RKE v1.1.0+优化了升级集群的流程,提供了不宕机升级的功能。本节讲述了如何在使用rke up命令升级集群的时候保证集群内的 pods 可用,实现不宕机升级。 不宕机升级的功能的工作原理是批量升级 worker 节点的同时,保证工作负载在至少一个节点上运行,详情请 阅读全文
posted @ 2022-03-10 21:35 Varden 编辑
摘要:本文讲述了升级 RKE 集群时,RKE 内部发生的事项,用户输入升级 RKE 集群的命令rke up以后,etcd 节点、controlplane 节点、worker 节点和插件在升级的过程中经历了哪些步骤。 RKE v1.1.0 及以上的升级流程 概述 RKE v1.1.0 及以上的版本提供了以下 阅读全文
posted @ 2022-03-10 21:08 Varden 编辑
摘要:使用 RKE 部署 Kubernetes 后,您可以升级 Kubernetes 集群中组件的版本、编辑Kubernetes services 列表或编辑插件。 先决条件 保证cluster.yml缺少system_images的说明和配置。 保证工作目录中有管理Kubernetes 集群状态所需的文 阅读全文
posted @ 2022-03-10 17:40 Varden 编辑
摘要:添加或删除节点 RKE 支持为 worker、controlplane、etcd 主机添加或删除节点。 您可以通过修改cluster.yml文件的内容,添加额外的节点,并指定它们在 Kubernetes 集群中的角色;或从cluster.yml中的节点列表中删除节点信息,以达到删除节点的目的。 添加 阅读全文
posted @ 2022-03-10 16:35 Varden 编辑
摘要:v0.2.0 开始可用 注意:这不是 "Kubernetes 中的 TLS 证书管理"。更多细节请参考Kubernetes 文档和 RKE cluster.yaml 示例。 证书是 Kubernetes 集群的重要组成部分,所有的 Kubernetes 组件都需要用到证书。您可以使用 RKE 的rk 阅读全文
posted @ 2022-03-10 16:12 Varden 编辑
摘要:RKE 产品简介 Rancher Kubernetes Engine,简称 RKE,是一个经过CNCF认证的 Kubernetes 安装程序。RKE 支持多种操作系统,包括 MacOS、Linux 和 Windows,可以在裸金属服务器(BMS)和虚拟服务器(Virtualized Server)上 阅读全文
posted @ 2022-03-10 11:01 Varden 编辑
摘要:扩容的OSD磁盘及id HCI-7 /dev/sdb ssd id=36 /dev/sdc ssd id=37 HCI-9 /dev/sdb sas id=48 /dev/sdc sas id=49 HCI-10 /dev/sdc sas id=54 /dev/sdd sas id=55 清理OSD 阅读全文
posted @ 2022-03-07 16:32 Varden 编辑
摘要:Slow Requests, and Requests are Blocked 慢速请求,并且请求被阻止 The ceph-osd daemon is slow to respond to a request and the ceph health detail command returns an 阅读全文
posted @ 2022-03-07 16:15 Varden 编辑
摘要:noup:OSD启动时,会将自己在MON上标识为UP状态,设置该标志位,则OSD不会被自动标识为up状态。 nodown:OSD停止时,MON会将OSD标识为down状态,设置该标志位,则MON不会将停止的OSD标识为down状态,设置noup和nodown可以防止网络抖动。 noout:设置该标志 阅读全文
posted @ 2022-03-07 16:03 Varden 编辑
摘要:块是字节序列(通常为 512)。基于块的存储接口是在 HDD、SSD、CD、软盘甚至磁带等介质上存储数据的成熟且常见的方式。无处不在的块设备接口非常适合与包括 Ceph 在内的海量数据存储进行交互。 **Ceph 块设备是精简配置的、可调整大小的,并将数据条带化存储在多个 OSD 上。Ceph 块设 阅读全文
posted @ 2022-03-06 22:35 Varden 编辑
摘要:Ceph 文件系统或CephFS是一个符合 POSIX 的文件系统,构建在 Ceph 的分布式对象存储RADOS之上。CephFS 致力于为各种应用程序(包括共享主目录、HPC 暂存空间和分布式工作流共享存储等传统用例)提供最先进的、多用途、高可用性和高性能文件存储。 CephFS 通过使用一些新颖 阅读全文
posted @ 2022-03-06 10:39 Varden 编辑
摘要:当您创建池并为每个池设置归置组 (PG) 的数量时,如果您没有专门覆盖默认值,Ceph 会使用默认值。我们建议覆盖一些默认值。具体来说,我们建议设置池的副本大小并覆盖默认的归置组数量。您可以在运行池命令时专门设置这些值。您还可以通过在Ceph 配置文件的[global]部分中添加新的来覆盖默认值。 阅读全文
posted @ 2022-03-06 10:26 Varden 编辑
摘要:[global] fsid = {cluster-id} mon_initial_ members = {hostname}[, {hostname}] mon_host = {ip-address}[, {ip-address}] #All clusters have a front-side p 阅读全文
posted @ 2022-03-05 14:56 Varden 编辑
摘要:命令 以下 CLI 命令用于配置集群: ceph config dump: 将转储集群的整个配置数据库。 ceph config get <who>: 将转储特定守护程序或客户端的配置(例如,mds.a),存储在监视器的配置数据库中。 ceph config set <who> <option> < 阅读全文
posted @ 2022-03-05 14:32 Varden 编辑
摘要:有两个 Ceph 守护进程在设备上存储数据: Ceph OSD(或对象存储守护进程)是 Ceph 中大部分数据的存储位置。一般来说,每个 OSD 都由单个存储设备支持,例如传统硬盘 (HDD) 或固态硬盘 (SSD)。**OSD 也可以由设备组合支持,例如用于大多数数据的 HDD 和用于某些元数据的 阅读全文
posted @ 2022-03-05 11:44 Varden 编辑
摘要:可以转换一些现有的集群,以便可以使用cephadm. 此声明适用于使用ceph-deploy、ceph-ansible或DeepSea部署的某些集群。 文档的这一部分解释了如何确定您的集群是否可以转换为可以管理它们的状态以及cephadm如何执行这些转换。 限制 Cephadm 仅适用于 BlueS 阅读全文
posted @ 2022-03-05 10:59 Varden 编辑
摘要:您可能需要调查 cephadm 命令失败的原因或某个服务不再正常运行的原因。 **Cephadm 将守护进程部署为容器。**这意味着对那些容器化的守护进程进行故障排除的工作方式可能与您预期的不同(如果您希望此故障排除的工作方式与所涉及的守护程序未容器化时的故障排除方式相同,那肯定是正确的)。 这里有 阅读全文
posted @ 2022-03-05 10:08 Varden 编辑
摘要:基本 CEPH 客户端设置 客户端机器需要一些基本配置才能与 Ceph 集群交互。本节介绍如何配置客户端机器,使其可以与 Ceph 集群交互。 笔记: 大多数客户端机器只需要安装ceph-common包及其依赖项。这样的设置提供了基本的ceph和rados命令,以及包括mount.ceph和rbd在 阅读全文
posted @ 2022-03-05 08:53 Varden 编辑
摘要:危险: 此操作将销毁该集群中存储的所有数据 为了破坏集群并删除该集群中存储的所有数据,请暂停 cephadm 以避免部署新的守护进程。 ceph orch pause 然后验证集群的 FSID: ceph fsid 清除集群中所有主机的 ceph 守护进程 # For each host: ceph 阅读全文
posted @ 2022-03-05 08:43 Varden 编辑
摘要:将 CEPH.CONF 分发给没有密钥环的主机 将 ceph.conf 文件分发到没有关联客户端密钥环文件的主机可能很有用。**默认情况下,cephadm 仅将 ceph.conf 文件部署到也分发客户端密钥环的主机(见上文)。**要将配置文件写入没有客户端密钥环的主机,请运行以下命令: ceph 阅读全文
posted @ 2022-03-05 08:40 Varden 编辑
摘要:Cephadm 可以将ceph.conf文件和客户端密钥环文件的副本分发到主机。通常最好将配置和密钥环的副本存储在 client.admin 用于通过 CLI 管理集群的任何主机上。默认情况下,cephadm 对任何具有 _admin 标签的节点(通常包括引导主机)执行此操作。 当客户端密钥环被置于 阅读全文
posted @ 2022-03-05 08:35 Varden 编辑
摘要:cephadm 模块提供额外的健康检查来补充集群提供的默认健康检查。这些额外的健康检查分为两类: cephadm 操作:当 cephadm 模块处于活动状态时,始终执行此类别的健康检查。 集群配置:这些健康检查是可选的,主要关注集群中主机的配置。 CEPHADM 操作 CEPHADM_PAUSED 阅读全文
posted @ 2022-03-05 08:20 Varden 编辑
摘要:Cephadm 将守护进程数据和日志存储在不同的位置,而不是旧的、cephadm之前(Octopus之前)版本的 ceph: /var/log/ceph/: 包含所有集群日志。**默认情况下,cephadm 通过 stderr 和容器运行时记录日志。**除非您按照cephadm-logs中的说明启用 阅读全文
posted @ 2022-03-04 22:53 Varden 编辑
摘要:记录日志 Ceph 守护进程传统上将日志写入/var/log/ceph。 Ceph 守护进程默认记录到日志中,并且 Ceph 日志由容器运行时环境捕获。它们可通过 journalctl 访问。 笔记: 在 Quincy 之前,ceph 守护进程会输出到stderr。 日志记录示例 例如,要查看具有 阅读全文
posted @ 2022-03-04 22:46 Varden 编辑
摘要:Cephadm 将日志写入cephadm集群日志通道。您可以通过读取已填满的日志来实时监控 Ceph 的活动。运行以下命令实时查看日志: ceph -W cephadm 默认情况下,此命令显示信息级别及以上的事件。要查看调试级消息和信息级事件,请运行以下命令: ceph config set mgr 阅读全文
posted @ 2022-03-04 22:10 Varden 编辑
摘要:Cephadm 可以安全地将 Ceph 从一个错误修复版本升级到下一个版本。例如,您可以从 v15.2.0(第一个 Octopus 版本)升级到下一个版本 v15.2.1。 自动升级过程遵循 Ceph 最佳实践。例如: 升级顺序从管理器、监视器开始,然后是其他守护程序。 只有在 Ceph 指示集群将 阅读全文
posted @ 2022-03-04 21:37 Varden 编辑
摘要:Ceph Dashboard 使用Prometheus、Grafana和相关工具来存储和可视化有关集群利用率和性能的详细指标。Ceph 用户有三种选择: 让 cephadm 部署和配置这些服务。这是引导新集群时的默认设置,除非使用该 --skip-monitoring-stack 选项。 手动部署和 阅读全文
posted @ 2022-03-04 20:56 Varden 编辑
摘要:部署 CEPHFS 使用CephFS文件系统需要一个或多个 MDS 守护进程。如果使用较新的 ceph fs volume 接口创建新的文件系统,则会自动创建这些文件。有关详细信息,请参阅FS卷和子卷。 例如: ceph fs volume create <fs_name> --placement= 阅读全文
posted @ 2022-03-04 17:13 Varden 编辑
摘要:列出设备 ceph-volume不时扫描集群中的每个主机,以确定哪些设备存在以及它们是否有资格用作 OSD。 要打印由 cephadm 发现的设备列表,请运行以下命令: ceph orch device ls [--hostname=...] [--wide] [--refresh] 例子: Hos 阅读全文
posted @ 2022-03-04 15:55 Varden 编辑
摘要:如果当前目录下已经有远程仓库,就会报如下的错: fatal: remote origin already exists. 此时,我们可以先 git remote -v 查看远程库信息: # git remote -v origin https://gitee.com/varden99/ansible 阅读全文
posted @ 2022-03-04 13:35 Varden 编辑
摘要:快速设置 — 如果你知道该怎么操作,直接使用下面的地址: https://gitee.com/varden99/test.git 我们强烈建议所有的git仓库都有一个README, LICENSE, .gitignore文件。 Git入门?查看帮助 , Visual Studio / Tortois 阅读全文
posted @ 2022-03-04 10:29 Varden 编辑
摘要:cephadm MGR 服务托管不同的模块,例如 Ceph Dashboard 和 cephadm manager 模块。 指定网络 MGR 服务仅支持绑定到网络中的特定 IP。 示例规范文件(利用默认位置): service_type: mgr networks: - 192.169.142.0/ 阅读全文
posted @ 2022-03-04 09:56 Varden 编辑
摘要:部署额外的监视器 一个典型的 Ceph 集群有 3 个或 5 个监控守护进程,它们分布在不同的主机上。如果集群中有五个或更多节点,我们建议部署五个监视器。 随着集群的增长,Ceph 会自动部署监控守护进程,而随着集群的缩小,Ceph 会自动缩减监控守护进程。这种自动增长和收缩的顺利执行取决于正确的子 阅读全文
posted @ 2022-03-03 22:15 Varden 编辑
摘要:警告: 为额外容器参数提供的参数仅限于您正在使用的任何容器引擎的运行命令可用的任何参数。提供run命令不支持的任何参数(或参数的无效值)将导致守护程序无法启动。 Cephadm 支持在可能需要时为特定情况提供额外的杂项容器参数。例如,如果用户需要限制他们的 mon 守护进程使用的 cpu 数量,他们 阅读全文
posted @ 2022-03-03 21:48 Varden 编辑
摘要:对于部署服务的编排器,它需要知道在哪里部署守护进程,以及部署多少。这是放置规范的作用。放置规范既可以作为命令行参数传递,也可以在 YAML 文件中传递。 笔记:cephadm 不会在带有_no_schedule标签的主机上部署守护进程;请参阅特殊主机标签。 笔记:apply命令可能会令人困惑。因此, 阅读全文
posted @ 2022-03-03 21:43 Varden 编辑
摘要:服务规范是用于指定服务部署的数据结构。以下是 YAML 中的服务规范示例: service_type: rgw service_id: realm.zone placement: hosts: - host1 - host2 - host3 unmanaged: false networks: - 阅读全文
posted @ 2022-03-03 21:18 Varden 编辑
摘要:守护进程是一个正在运行的 systemd 单元,它是服务的一部分。 要查看守护程序的状态,请执行以下操作: 打印编排器已知的所有守护进程的列表。 查询目标守护进程的状态。 首先,打印编排器已知的所有守护进程的列表: ceph orch ps [--hostname host] [--daemon_t 阅读全文
posted @ 2022-03-03 20:47 Varden 编辑
摘要:要查看 Ceph 集群中运行的服务之一的状态,请执行以下操作: 使用命令行打印服务列表。 找到您要检查其状态的服务。 打印服务的状态。 以下命令打印编排器已知的服务列表。要将输出限制为仅指定主机上的服务,请使用可选--host参数。要将输出限制为仅特定类型的服务,请使用可选--type参数(mon、 阅读全文
posted @ 2022-03-03 20:43 Varden 编辑
摘要:列出与集群关联的主机: ceph orch host ls [--format yaml] [--host-pattern <name>] [--label <label>] [--host-status <status>] 其中可选参数“host-pattern”、“label”和“host-st 阅读全文
posted @ 2022-03-03 17:33 Varden 编辑
摘要:##CEPH 依赖 作为一般规则,我们建议在较新版本的 Linux 上部署 Ceph。我们还建议在具有长期支持的版本上进行部署。 ###LINUX 内核 Ceph 内核客户端 如果您使用内核客户端来映射 RBD 块设备或挂载 CephFS,一般建议是使用http://kernel.org或任何Lin 阅读全文
posted @ 2022-03-03 14:08 Varden 编辑
摘要:Ceph 设计为在商用硬件上运行,这使得构建和维护PB级数据集群在经济上可行。在规划集群硬件时,您需要平衡许多考虑因素,包括故障域和潜在的性能问题。硬件规划应包括将 Ceph 守护进程和其他使用 Ceph 的进程分布在多台主机上。通常,我们建议在为该类型的守护进程配置的主机上运行特定类型的 Ceph 阅读全文
posted @ 2022-03-03 11:16 Varden 编辑
摘要:无论您是想为云平台提供Ceph 对象存储或 Ceph 块设备服务、部署Ceph 文件系统还是将 Ceph 用于其他目的,所有 Ceph 存储集群部署都从设置每个 Ceph 节点、您的网络和 Ceph开始存储集群。一个 Ceph 存储集群至少需要一个 Ceph Monitor、Ceph Manager 阅读全文
posted @ 2022-03-02 21:57 Varden 编辑
摘要:如果您收到一个 active + clean + inconsistent 状态,这可能是由于清理期间的错误而发生的。与往常一样,我们可以通过以下方式识别不一致的归置组: $ ceph health detail HEALTH_ERR 1 pgs inconsistent; 2 scrub erro 阅读全文
posted @ 2022-03-02 21:29 Varden 编辑
摘要:我们建议每个 OSD 守护程序至少有 4GB 的 RAM,并建议从 6-8GB 向上取整。 您可能会注意到,在正常操作期间,ceph-osd 进程只使用该数量的一小部分。未使用的 RAM 很容易将多余的 RAM 用于共存应用程序或节省每个节点的内存容量。 然而,当 OSD 经历恢复时,它们的内存利用 阅读全文
posted @ 2022-03-01 14:19 Varden 编辑

点击右上角即可分享
微信分享提示