【Ceph】Ceph源码分析之Async模块
原文:https://blog.csdn.net/hawkerou/article/details/65449957
1、异步通信核心模块EventCenter+Epoll
概述
EventCenter是Async异步消息通信的核心模块,通过事件/回调模型向上提供异步消息通信,每个Async下的worker线程负责处理一个EventCenter的事件集合。EventCenter针对不同类型的事件使用不同的事件监听来处理事件回调。
详细设计
事件类型
目前EventCenter共支持4种类型的事件,每个worker线程在进入事件处理逻辑的时候,会分别对这4种事件类型的事件进行处理
- file_events:fd类事件
- time_events/event_map:定时器类事件
- external_events/external_num_events:外部事件(时间为0的定时事件)
- pollers:轮询类事件(目前是DPDk模块在使用)
事件操作
event_center对外提供创建/删除:fd、time、external 3种类型的事件,poller事件则需要EventCenter::Poller的派生类自行实现poll方法。下面介绍下4种事件的监听方式:
-
fd类事件
支持dpdk、epoll、kqueue、select4种监听方式。以epoll为例子,则是封装的epoll_create/epoll_ctl/epoll_wait接口来向EventCenter提供监听操作接口。(定义在EventEpoll.cc/h)
-
time类事件
通过定时器来监听
-
外部事件
外部事件实际上是定时时间为0的时间,也就是立马执行,设计这个事件的主要目的切换线程上下文,来避免死锁问题。
- pollers
派生类的poll轮询
事件的处理
每个worker的线程负责处理EventCenter的底层监听事件集合,因此对EventCenter事件的处理主要在每个worker的线程函数,每个事件的处理逻辑如下:
- 处理fd类事件
通过底层epoll_wait取得可以处理的事件集合,然后再根据注册的读写事件分别调用对应的cb(不会主动将已经注册的事件去除掉,需要上层连接调用注销事件才能删除fd类事件)。
- 处理time类事件
检测时间是否到达,到达则调用对应cb- 处理external_events
external_events类事件,不需要条件,只要有,就处理,重点在于:会清空外部事件。- 处理pollers
调用每个poolers[i]->poll()方法来轮询
Pipe管道设计
fd类事件的监听方式,比如epoll,在使用epoll_wait的时候可能存在阻塞(timeout)会使线程睡眠,对于有些需要马上处理的消息,则线程无法及时处理,因此center就设计了一对Pipe管道,通过监听管道的写事件来唤醒睡眠的线程。管道的创建是在EventCenter初始化的时候
EventCenter::init(...)
.....
notify_receive_fd = fds[0];
notify_send_fd = fds[1];
在启动worker线程处理的时候,会在set_owner接口里面创建管道的读端监听事件。
notify_handler = new C_handle_notify(this, cct);
int r = create_file_event(notify_receive_fd, EVENT_READABLE, notify_handler);
管道的写端则是在wakeup接口里面
int n = write(notify_send_fd, &buf, sizeof(buf));
因此通过这种机制就可以唤醒线程
global_center设计
global_center是为了维护一个全局的EventCenter表,它通过单例模式来实现一个唯一的全局变量。具体实现是:在启动每个worker线程处理的时候,每个worker都会调用
EventCenter::set_owner
这个接口来设置owner属性和添加EventCenter给global_center表
事件回调的设计
EventCenter封装了事件的回调基类EventCallback/EventCallbackRef,对于上层使用者来说,注册的事件回调必须是这个基类的派生类,封装这个基类最主要的逻辑是调用do_request接口,因此每个事件回调核心实现都在其do_request里面去实现即可。
结束
EventCenter的设计模型还是比较简单,但是是Async模块实现异步通信的核心,下个章节来介绍Async中间通信模型。
涉及源码:${ceph}/src/msg/async/Event*
2、上层通信模型
在博文Ceph源码分析之Async模块:1、异步通信核心模块EventCenter+Epoll 里面介绍了Async实现异步通信的底层核心模块。这次打算从上层应用来看ceph的通信模型模型。
ceph通信模块的源代码定义在msg目录下,消息类型定义在message目录下面。
概述
ceph各个组件直接的通信以及和客户端直接的通信都依赖与ceph的通信模块,捋清楚通信模块对阅读源代码会有帮助。
先看一张简单的交互图
ceph通信模块的角色主要分为Messenger和Dispatcher两大角色
-
Messenger
消息管理器,对上负责将消息转给Dispatcher和提供发送消息的接口:send_message,对下负责将应用发送的消息转发给Connection(封装的socket连接实例)
-
Dispatcher
消息分法器,根据消息类型将消息分发给应用层的具体操作接口
其它涉及到的两个重要的角色
-
Message
消息格式基类,可以根据需求派生出不同类型的消息,不同的消息类型定义在message目录下面,最大的不同就是msg_type(消息类型)
-
Connection
连接实例,负责维护同客户端建立的socket连接以及ceph的协议栈操作接口(在Async中间层协议栈的时候会深入介绍),向上提供发送消息接口及转发底层消息给DispathcQueue或者消息管理器,向下发送和介绍消息。
模块设计
使用ceph通信模块来收发消息
* 发送消息
发消息比较简单,应用只需将消息内容按照需要的消息类型(定义在messaging/*或自定义)进行封装后调用Messenger的send_message即可。
- 接收消息
Messenger是如何将消息转给应用的或者说是如何管理?Messenger设计了两个分发器管理成员:dispatchers和fast_dispatchers,用来处理不同类型的请求处理。应用层则按需求将不同的分发器注册给Messenger,进而Messenger接收到底层来的消息时,会将消息分发给已经注册的两个dispatchers。
设计fast_dispatchers的目的就是为了让有些消息能够省去底层的一层流程(比如跳过入队列),直接到达应用。Dispatcher类是一个基类,里面设计封装了应用同Messenger交互的接口(每个具体的Dispatcher派生类自行去实现更具体的消息处理,一般都是再根据消息类型来分开处理消息)。Dispatcher并不是所有的接口封装都是为了转发消息,它更深层次的含义是提供一个应用层和底层的通信接口,而这个接口的桥梁是Messenger消息管理器。
当底层有消息到来时,Messenger会将消息转给dispatcher对于的ms_*系列的接口,最常用的是ms_dispatch接口,因此你可以看到像monitor,osd这些应用的核心消息处理都在ms_dispatch接口里面实现。
Dispatcher的使用
-
最简单的方式就是应用本身作为Dispatcher的派生类,如此,Messenger便是直接通过应用关联,比如Monitor、osd、mgr都是应用组件本身作为Dispatcher的派生类。
-
申请一个Dispatcher的派生类实例,做为应用的模块注册给Messenger,比如RadosClient里面会注册各个Client给Messenger,而这些Client都是Dispatcher的派生类。
消息类型
ceph的消息基类是:Message,Message里面设计了一个type成员,用来区分不同的消息类型,不同的消息模块可以通过type来构造,而这些type定义在Message.h中
技巧:比如你想要看某个消息是谁发的,那么你只需要去查看这个消息类型对应的消息模块有哪些,然后再查到谁在使用这个消息模块来封装消息,进而就可以找到发送这个消息的地方。
例子
以ceph-mon为例子,Monitor类继承自Dispatcher
class Monitor : public Dispatcher,
实现它的ms_dispatcher方法,这个方法里面实现了mon的消息处理
注册给Messenger,add_dispatcher_tail方法就是将当前应用添加到dispatcher列表中
messenger->add_dispatcher_tail(this);
Messenger收到消息转给dipatcher
void ms_deliver_dispatch(Message *m) {
m->set_dispatch_stamp(ceph_clock_now());
for (list<Dispatcher*>::iterator p = dispatchers.begin();
p != dispatchers.end();
++p) {
if ((*p)->ms_dispatch(m))
return;
}
lsubdout(cct, ms, 0) << "ms_deliver_dispatch: unhandled message " << m << " " << *m << " from "
<< m->get_source_inst() << dendl;
assert(!cct->_conf->ms_die_on_unhandled_msg);
m->put();
}
ceph monitor处理消息
bool ms_dispatch(Message *m) override {
lock.Lock();
_ms_dispatch(m);
lock.Unlock();
return true;
}