摘要:
BACKOFF 通常,OSD会简单地将任何不能立即在内存中处理的请求进队,直到它可以处理的时间。这可能会产生问题,因为OSD会限制传入消息所消耗的RAM总量:如果达到消息数量或字节数量的任何一个阈值,新的消息将不会从网络套接字中读取,从而通过网络造成反压力。 然而,在某些情况下,OSD知道或预计PG
阅读全文
posted @ 2021-12-10 11:34
苏格拉底的落泪
阅读(429)
推荐(0)
摘要:
概述 OSD是RADOS集群的基本存储单元。 PG(placement group)从名字可理解为放置策略组,它是对象的集合,该集合里的所有对象都具有相同的放置策略:对象的副本都分布在相同的OSD列表上。一个对象只能属于一个PG,一个PG对应于放置在其上的OSD列表。一个OSD上可以分布多个PG。处
阅读全文
posted @ 2021-12-10 10:21
苏格拉底的落泪
阅读(2064)
推荐(0)
摘要:
OSD的内部队列 由于op可能各种各样的原因需要背推迟处理,为此PG内部维护了多种op重试队列,它们的含义下表所示: 队列名称 入队条件 wait_for_map 当收到op时,已经有来自同一个客户端的op存在于此队列中,,或者op携带的Epoch大于PG当前的Epoch waiting_for_p
阅读全文
posted @ 2021-12-09 22:02
苏格拉底的落泪
阅读(167)
推荐(1)
摘要:
PG相关命令 查询pool中pg的详细信息 ceph pg ls-by-pool default.rgw.buckets.data
阅读全文
posted @ 2021-12-09 16:53
苏格拉底的落泪
阅读(65)
推荐(0)
摘要:
boost安装 可执行文件下载:https://hadoop.apache.org/releases.html: yum install boost yum install boost-devel yum install boost-doc boost编译: ./bootstrap.sh ./b2
阅读全文
posted @ 2021-12-09 16:14
苏格拉底的落泪
阅读(483)
推荐(0)
摘要:
Ceph IO, Rados IO 流程解析(读写) CEPH RADOS IO(读写) 处理流程图: CPEH读写顺序保证: 不同对象的并发控制 不同的对象有可能落到同一个pg里,ceph实现里,在OSD的处理线程中就会给PG加锁,一直到queue_transactions里把事务放到bluest
阅读全文
posted @ 2021-12-09 14:19
苏格拉底的落泪
阅读(840)
推荐(0)
摘要:
稀疏写 我们知道一个文件的逻辑空间上是连续的,但是真正在磁盘上的物理空间分布并不一定是连续的。同时我们也会使用lseek系统调用,使得文件偏移量大于文件的长度,此时再对文件写入,便会在文件中形成一个空洞,这些空洞中的字节都是0。空洞是否占用磁盘空间是有文件系统决定的,不过大部分的文件系统ext4、x
阅读全文
posted @ 2021-12-09 10:04
苏格拉底的落泪
阅读(936)
推荐(0)
摘要:
LExtent Extent是对象内的基本数据管理单元,数据压缩、数据校验、数据共享等功能都是基于Extent粒度实现的。这里的Extent是对象内的,并不是磁盘内的,所以我们称为lextent,和磁盘内的pextent以示区分。 struct Extent { // 对象内逻辑偏移,不需要块对齐。
阅读全文
posted @ 2021-12-08 16:44
苏格拉底的落泪
阅读(191)
推荐(0)
摘要:
参考资料 1. ceph bluestore 写操作源码分析(上) 2. ceph bluestore中的磁盘空间管理 3. Ceph luminous + bluestore存储引擎部署 4. BlueStore源码分析之对象IO 5. Ceph luminous + bluestore存储引擎部
阅读全文
posted @ 2021-12-08 10:21
苏格拉底的落泪
阅读(447)
推荐(0)
摘要:
int BlueStore::_minimal_open_bluefs(bool create) { bluefs = new BlueFS(cct); /** * 在这里,会创建三个块设备block.db、block、block.wal * * bluefs->add_block_device用于
阅读全文
posted @ 2021-12-07 18:25
苏格拉底的落泪
阅读(220)
推荐(0)
摘要:
参考资料 1. ceph-bluestore-tool 工具实践及源代码解析 2. Ceph-Volume源码分析osd创建和开机自启
阅读全文
posted @ 2021-12-07 16:41
苏格拉底的落泪
阅读(199)
推荐(0)
摘要:
预分配磁盘空间 我们在开发程序的过程中,往往需要预分配磁盘空间,防止因磁盘空间不够而引发程序异常问题(已踩过坑), 现网查阅资料,有些预分配磁盘空间的方法不正确。 1.1 posix_fallocate函数 函数原型: #include <fcntl.h> int posix_fallocate(i
阅读全文
posted @ 2021-12-06 22:13
苏格拉底的落泪
阅读(813)
推荐(0)
摘要:
参考资料 1.Linux Page Cache的理解 2. Linux系统中的Page cache和Buffer cache 3.Linux 的 Page Cache
阅读全文
posted @ 2021-12-06 21:35
苏格拉底的落泪
阅读(100)
推荐(0)
摘要:
BlueStore源码分析之BitMap分配器 参考资料 1. BlueStore源码分析之BitMap分配器
阅读全文
posted @ 2021-12-06 19:56
苏格拉底的落泪
阅读(173)
推荐(0)
摘要:
扇区与块/簇 如图所示,描述介绍了扇区、磁道等概念: A:Track 磁盘磁道(粉红色部分) B:Geometrical sector 几何学中的扇形(紫色部分) C:Track sector 磁盘扇区(玫红色部分) D:Cluster 块/簇(绿色部分) 说完扇区,就不得不提一些其他相关概念,因为
阅读全文
posted @ 2021-12-06 17:52
苏格拉底的落泪
阅读(425)
推荐(0)
摘要:
Ceph 集群在运行一段时间后常会碰到OSD 数据不均衡的时候,有的OSD 使用率超过的80%,有的甚至不足60%。一般有两种方法去均衡各个OSDs 间的数据 OSD Reweight 其实就是给各个OSDs 设置均衡权重(区别OSD weight 是根据容量设置的固定权重) 调整数据量超过阀值的O
阅读全文
posted @ 2021-12-06 14:13
苏格拉底的落泪
阅读(1719)
推荐(0)
摘要:
参考资料 1. ceph internal 之 底层对象
阅读全文
posted @ 2021-12-03 15:39
苏格拉底的落泪
阅读(41)
推荐(0)
摘要:
osd_data "/var/lib/ceph/osd/$cluster-$id" path to OSD data osd_journal "/var/lib/ceph/osd/$cluster-$id/journal" path to OSD journal (when FileStore ba
阅读全文
posted @ 2021-12-03 10:20
苏格拉底的落泪
阅读(74)
推荐(0)
摘要:
uuidgen ceph osd create uuidgen mkdir -R /var/lib/ceph/osd/ceph-3 ceph-osd -i 0 --mkfs --mkkey --osd-uuid 63970d8a-597a-4123-9767-097f88bbcd00 sudo ce
阅读全文
posted @ 2021-12-02 17:42
苏格拉底的落泪
阅读(143)
推荐(0)
摘要:
OSD模块在tp_osd_tp线程上下文的最后阶段,通过queue_transactions调用FileStore模块功能将操作请求以日志的方式提交到日志队列中,至此tp_osd_tp线程中的工作就完成了。后续由一个独立的日志写入线程journal_write从日志队列中取出操作日志并调用文件系统写
阅读全文
posted @ 2021-12-02 15:31
苏格拉底的落泪
阅读(384)
推荐(0)
posted @ 2021-12-02 15:08
苏格拉底的落泪
阅读(31)
推荐(0)
摘要:
OSD写操作失效如何处理 很多人对Ceph写操作的异常处理的过程还不是特别的清楚。本文就介绍Ceph如何处理异常处理的。 首先需要明确的是,Ceph的读写操作并没有超时机制。 rbd_write并没有超时机制。所有经常看到,用ceph -s 命令查看,有些 slow request请求会显示延迟 3
阅读全文
posted @ 2021-12-02 10:31
苏格拉底的落泪
阅读(597)
推荐(0)
摘要:
ceph-kvstore-tool 查看mon数据库中都有哪些表项 ceph-kvstore-tool rocksdb /var/lib/ceph/mon/ceph-node1/store.db/ list|awk '{print $1}'|uniq 参考资料 1. ceph-kvstore-too
阅读全文
posted @ 2021-12-02 09:37
苏格拉底的落泪
阅读(314)
推荐(0)
摘要:
class PG min_last_complete_ondisk 这个表示各个副本上last_complete的最小版本,是主OSD在收到3个副本都完成时再进行计算的,也就是计算last_complete_ondisk和其他副本OSD上的last_complete_ondisk,即peer_las
阅读全文
posted @ 2021-12-01 16:36
苏格拉底的落泪
阅读(63)
推荐(0)
摘要:
OSD 图解如下: 接下来我们看一下tp_osd_tp线程是如何处理分片中的请求,线程处理的核心函数是ShardedOpWQ::_process,其调用栈如下: ShardedOpWQ::_process() |-OpQueue<>::dequeue() |-OSD::_look_up_pg() \
阅读全文
posted @ 2021-12-01 15:42
苏格拉底的落泪
阅读(929)
推荐(0)
摘要:
struct pg_log_entry_t { ObjectModDesc mod_desc; //用于保存本地回滚的一些信息,用于EC模式下的回滚操作 bufferlist snaps; //克隆操作,用于记录当前对象的snap列表 hobject_t soid; //操作的对象 osd_reqi
阅读全文
posted @ 2021-12-01 15:08
苏格拉底的落泪
阅读(902)
推荐(0)
摘要:
1.1 acting set和up set acting set是一个PG对应副本所在的OSD列表,该列表是有序的,列表中第一个OSD为主OSD。在通常情况下,up set和acting set列表完全相同。要理解他们的不同之处,需要理解下面介绍的“临时PG”概念。 1.2 临时PG 假设一个PG的
阅读全文
posted @ 2021-12-01 14:36
苏格拉底的落泪
阅读(650)
推荐(0)
摘要:
PG 状态 statedescription Activating Peering已经完成,PG正在等待所有PG实例同步并固化Peering的结果(Info、Log等) Active PG可以正常处理来自客户端的读写请求 Backfilling PG正在执行Backfill。Backfill总是在R
阅读全文
posted @ 2021-12-01 14:02
苏格拉底的落泪
阅读(389)
推荐(0)
摘要:
命令rados 删除pool test: rados purge test --yes-i-really-really-mean-it 查看资源池信息: rados df -p pool1 -p test # 参数是指定具体资源池,如果不加,则显示所有 创建rados对象: rados -p tes
阅读全文
posted @ 2021-12-01 10:41
苏格拉底的落泪
阅读(350)
推荐(0)
摘要:
ceph-objectstore-tool工具 基本命令使用如下:ceph-objectstore-tool --data-path /var/lib/ceph/osd/ceph-8/ --type bluestore xxx一般前半部分如左,指定osd路径,指定存储引擎(bluestore或者fi
阅读全文
posted @ 2021-12-01 10:12
苏格拉底的落泪
阅读(906)
推荐(0)
摘要:
亲和性 #Ceph 客户端读写数据时,总是连接 acting set 里的主 OSD (如 [2, 3, 4] 中, osd.2 是主的)。#有时候某个 OSD 与其它的相比并不适合做主 OSD (比如其硬盘慢、或控制器慢),最大化硬件利用率时为防止性能瓶颈(特别是读操作),#你可以调整 OSD 的
阅读全文
posted @ 2021-12-01 09:35
苏格拉底的落泪
阅读(333)
推荐(0)
摘要:
radosgw-admin bucket limit check
阅读全文
posted @ 2021-11-26 10:55
苏格拉底的落泪
阅读(25)
推荐(0)
摘要:
rsync断点续传 1. 断点续传命令: rsync -P --rsh=ssh /root/test 172.10.33.87:/root/test 需求:主机A传送文件夹TestDB到主机B,实验rsync断点续传的过程记录: [oracle@rac1-server TestDB]$ rsync
阅读全文
posted @ 2021-11-24 22:56
苏格拉底的落泪
阅读(346)
推荐(0)
摘要:
vim多文件操作 1. 在终端输入如下命令,即可打开所有想要打开的文件: vim file1 file2 ... 2. Vim已经启动,输入如下命令可以再打开一个文件,并且此时里会显示file文件的内容: :e file 两文件之间的切换: Ctrl+6 多文件操作中,切换下一个文件: :bn 上一
阅读全文
posted @ 2021-11-24 21:42
苏格拉底的落泪
阅读(171)
推荐(0)
摘要:
分屏模式 垂直分屏 :vs [file] vs 将当前文件垂直分屏 vs file 创建新文件并垂直分屏 2. 水平分屏 :sv [file] ::sp [file] sv 将当前文件水平分屏 sv file 创建新文件并水平分屏 分屏屏间光标移动 分屏间循环移动光标:ctrl-w ctrl-w c
阅读全文
posted @ 2021-11-24 21:26
苏格拉底的落泪
阅读(2565)
推荐(0)
摘要:
自动格式化代码 步骤如下: 1. gg 快捷键跳转到第一行 2. shift + v 转到可视模式 3. shift + g 全选 4. 敲击 键盘“=”按键 在没有权限的情况下,打开vim文件,修改后的保存: :w !sudo tee % 参考资料 1. vim中自动格式化代码
阅读全文
posted @ 2021-11-24 21:20
苏格拉底的落泪
阅读(61)
推荐(0)
摘要:
Vim基本快捷键 屏幕【向下】移动一页,相当于【Page Down】按键:ctrl + f ctrl + f ctrl + f 屏幕【向上】移动一页,相当于【Page Up】按键 ctrl + b 屏幕【向下】移动半页 ctrl + d 屏幕【向上】移动半页 ctrl + u 光标向后查找整个关键词
阅读全文
posted @ 2021-11-24 13:05
苏格拉底的落泪
阅读(354)
推荐(0)
摘要:
数据流重定向 命令: $ command > file 2>&1 $ command >> file 2>&1 这里的&没有固定的意思。放在>后面的&,表示重定向的目标不是一个文件,而是一个文件描述符,内置的文件描述符说明如下: 换言之 2>1 代表将stderr重定向到当前路径下文件名为1的reg
阅读全文
posted @ 2021-11-16 22:45
苏格拉底的落泪
阅读(115)
推荐(0)
摘要:
install install和cp类似,都可以将文件/目录拷贝到指定的地点。但是,install允许你控制目标文件的属性。install通常用于程序的makefile(在RPM的spec里面也经常用到),使用它来将程序拷贝到目标(安装)目录 --backup[=CONTROL]:为每个已存在的目的
阅读全文
posted @ 2021-11-16 22:01
苏格拉底的落泪
阅读(1420)
推荐(1)
摘要:
centos8 stream仓库配置 默认仓库: [root@centos8-stream yum.repos.d]# ll total 48 -rw-r--r--. 1 root root 713 Mar 28 2022 CentOS-Stream-AppStream.repo -rw-r--r-
阅读全文
posted @ 2021-11-16 21:41
苏格拉底的落泪
阅读(133)
推荐(0)