青山相待

            白云相爱

            梦不到紫罗袍共黄金带

            一茅斋

            野花开

            管甚谁家兴废谁成败

            陋巷单瓢亦乐哉

            贫,气不改!

            达,志不改!

redis BIO详解

BIO即background I/O service,后台I/O服务,是redis的aof持久化后台服务。

 

redis把阻塞的同步I/O操作交给后台I/O服务来完成:close和fsync。

 

close加入BIO的原因
1.如果fd是特定文件描述符的最后一份拷贝,那么文件描述符相关的资源会被释放。
2.如果fd是最后一个引用文件描述符的,并且文件描述符之前已经使用unlink进行删除,那么文件会被删除。
资源释放和文件删除是非常慢的,会阻塞服务器

 

fsync加入BIO的原因
把内存中修改的文件数据同步到磁盘。调用者将被阻塞至磁盘报告同步完成。

 

BIO的设计
目前有两种任务:fsync和close。每种任务一个队列和一个线程。

 

// 存放工作的队列
static list *bio_jobs[REDIS_BIO_NUM_OPS];

 

// 记录每种类型 job 队列里有多少 job 等待执行
static unsigned long long bio_pending[REDIS_BIO_NUM_OPS];

 

//初始化后台服务,启动后台线程
void bioInit(void)

 

//创建后台任务
void bioCreateBackgroundJob(int type, void *arg1, void *arg2, void *arg3) 

 

//处理后台任务,后台线程启动函数
void *bioProcessBackgroundJobs(void *arg)
{
    //当任务数为0的时候,调用pthread_cond_wait等待通知
    //任务数不为0的时候,从队列取任务并处理
        // 执行任务,type即线程启动的入参,每个后台线程处理一种任务
        if (type == REDIS_BIO_CLOSE_FILE) {
            close((long)job->arg1);
        } else if (type == REDIS_BIO_AOF_FSYNC) {
            aof_fsync((long)job->arg1);
        } else {
            redisPanic("Wrong job type in bioProcessBackgroundJobs().");
        }
}

 

BIO的结构

 

 

BIO技术应用和优化
aof有三种持久化方案
1。内核同步,交给内核去缓存的数据到磁盘,大约30s一次。
2.每秒同步,这是作者推荐的同步方案,和内核同步几乎一样快。
3.每次都同步,性能极差,作者都恨不得删掉这个功能。

 

fsync放在单独线程处理存在的问题
fsync线程的使用和主线程的write存在冲突,在fsync进行的时候,write将被阻塞,fsync期间write不能执行,直到fsync完成。
redis中实现了一种优化

 

部分代码
void flushAppendOnlyFile(int force) {
    // 策略为每秒 FSYNC 
    if (server.aof_fsync == AOF_FSYNC_EVERYSEC)
        // 是否有 SYNC 正在后台进行?
        sync_in_progress = bioPendingJobsOfType(REDIS_BIO_AOF_FSYNC) != 0;
    // 每秒 fsync ,并且强制写入为假
    if (server.aof_fsync == AOF_FSYNC_EVERYSEC && !force) {
         * 如果后台仍在执行 FSYNC ,那么我们可以延迟写操作一两秒
         * (如果强制执行 write 的话,服务器主线程将阻塞在 write 上面)
         */
        if (sync_in_progress) {
            // 有 fsync 正在后台进行 。。。
             * 如果后台还有 fsync 在执行,并且 write 已经推迟 >= 2 秒
             * 那么执行写操作(write 将被阻塞)
             */
    //write写入缓冲区
    nwritten = write(server.aof_fd,server.aof_buf,sdslen(server.aof_buf));
优化方案
当aof同步方式为每秒同步时,主线程的write进行优化,如果执行write时fsync服务正在同步中,那么推迟write的时间,最多推迟两秒,如果等待两秒后fsync仍在同步,执行强制write操作,主线程将阻塞等待write完成。

 

fsync服务线程和bgsave以及bgrewriteaof子进程的冲突
这时候不应该执行fsync
    if (server.aof_no_fsync_on_rewrite &&
        (server.aof_child_pid != -1 || server.rdb_child_pid != -1))
            return;

 

作者关于fsync服务线程的博客
posted @ 2016-07-12 10:19  Leo.Z  阅读(1844)  评论(0编辑  收藏  举报