代码改变世界

Python 使用flush函数将缓冲区数据立即写磁盘

2014-11-01 19:59  commandow  阅读(6018)  评论(0编辑  收藏  举报

1 问题

在后台领域,经常用python做一些简单服务,实现起来速度较快、变化较灵活,相比C++,成本要低很多。作为后台服务,在观察服务运行情况时,都希望服务能够实时输出日志数据,以便观察。之前我用python写的一个服务,发现就没有实时把数据写到磁盘,导致在观察数据时,发现实际上某个行为已经执行成功了,但日志并未有记录。

2 原因分析及解决

示例代码:

#!/usr/bin/env python
# -*- coding: gbk -*-

import time

fd = open("a.txt", "a")
i = 0
while 1:

    buf = "a\n"
    fd.write(buf)
    time.sleep(1)
    i = i + 1

    if i > 10:
        break

fd.close()

代码的功能很简单,每一秒把“a”写入文件a.txt中。在运行中,发现在运行10秒后,文件a.txt才会真正完成数据的写入。原因是很简单,python的实现中,调用write后,只是把数据写到内核缓冲区,实际上并没有把数据写到磁盘上,只有调用close或是内核缓冲区满的情况下,数据才会写入磁盘中。

我们抽象一下来看,对于我们的服务来说,我们通常会这样写代码:

#!/usr/bin/env python
# -*- coding: gbk -*-

import time

i = 0
while 1:

    # 干活
    do_something()

    # 刷新缓冲区,把数据写到磁盘上,fd为打开的文件句柄,假设你在系统已经打开了
    fd.flush()

对于我们来说,服务每次do_something,我们都希望实时观察到输出。调用flush函数,在每次循环后,都可以把数据输出到磁盘,这样便可实时观察到日志输出。

当然,频繁使用这个函数,要考虑性能问题,系统频繁的将数据写到磁盘,是比较耗CPU的,对于服务访问量不大的情况,这样使用还是比较方便的。