智慧的老鸟

一个程序员需要有一棵Gank的心,Dota能培养我。

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

linux的时间函数有其特别需要注意的使用方法,在工程项目中,这点很容易忽视,本文就时间函数在多线程中的使用作一个小结。

首先看一个函数,取下一天的功能函数,该函数使用了时间函数localtime或者localtime_r来获取系统时间。
int GetNextTime(int curtm)
{
 struct tm t;
 t.tm_year = curtm/10000 - 1900;
 t.tm_mon = ((curtm/100)%100 - 1);
 t.tm_mday = (curtm)%100;
 t.tm_hour = 1;
 t.tm_min = 0;
 t.tm_sec = 0;

 time_t nt;
 //struct tm *local;
 struct tm local;
 char buf[16];

 nt = mktime(&t) + 24 * 3600;
 //local = localtime(&nt); // ------------------(1)
 localtime_r(&nt, &local); // ------------------(2)
 sprintf(buf, "%4d%02d%02d%02d%02d%02d", local.tm_year+1900,local.tm_mon+1,local.tm_mday,0,0,0);
 
 return (int)(atol(buf)/1000000);
}

接着,将函数封装在线程类中,以方便测试多线程使用时间函数localtime或者localtime_r。
class mythread : public Thread
{
 public:
  mythread():m_isRun(false) {}
  virtual void Run()
  {
   int begin = 19860101;
   int end = 20130104;
   int count = 0;
   int cur = begin;
   int next;
   while(cur != end)
   {
    next = GetNextTime(cur);
    count++;
    cur = next;
   }
   if(count != 9865) // 19860101-20130104理论上一共有9865天,如果多线程算出的不是,则打印出来
    cout << count << endl;
  }

  virtual void Stop(){m_isRun=true;}
  virtual ~mythread() {}
 private:
  bool m_isRun;
};

测试:
void threadtest()
{
 for(int k=0;k<20;k++)
 {
  mythread p[30];
  for(int i = 1;i<30;i++)
    p[i].Start();
  for(int i = 1;i<30;i++)
    p[i].Join();
  for(int i = 1;i<30;i++)
    p[i].Stop();
  cout << "the " << k << " test end!" << endl;
 }
}

结果可见,如果时间函数用(1)则,开多线程调用就会报出count不是正确的数量;而用(2)则正确。因此,linux时间函数中——
localtime函数只能用于单线程;而多线程中应该选择用localtime_r。后者是线程安全的时间函数。

mktime,localtime_r,gettimeofday是线程安全的吗?

一下摘自:http://hi.baidu.com/pkuyikai/item/aad084ca252966d797445246

之前为了诊断系统的检索性能中的问题,分阶段地对程序进行了计时,诊断出的结果是:记录越多,那么这三个阶段所消耗的时间就越长。而反复review三个阶段的主要工作代码,却发现这些代码根本不可能这么耗时。慢慢地,顺藤摸瓜地查出时间消耗都发生在获取时间值的方法——mktime()上。于是大家一致怀疑是mktime()方法以及相关的localtime_r()方法都不是线程安全的。可其他项目中也用这些方法,为什么他们就没有发现这样的问题呢?

在glibc的文档描述中,glibc提供了一个线程安全的方法localtime_r来代替localtime。mktime不存在线程不安全的问题。所以,按照glibc的文档,在多线程环境下可以安全的使用localtime_r和mktime,实际情况并非如此。找来mktime()和localtime_r()的源代码,终于发现了奥妙所在。

mktime和localtime_r在实现上都考虑了时区的转换,而时区的计算要使用全局变量tzname/timezone/daylight。这本质上就是线程不安全的。

通过对glibc中这两个系统函数源代码的分析可以知道,它们实现中有两个问题:

1、tzset_internal 中使用的static变量is_initialized

2、mktime每次都要重写全局变量tzname/timezone/daylight

所以mktime和localtime_r不适合于多线程应用。

 

解决方案有二:

1、自己实现mktime和localtime_r,但是这样时区的计算是麻烦的,当然也可以不使用时区信息,或者使用固定时区,比如北京时区,这样就简单多了。由于公司的服务器基本不会有时区问题,因此我们也自己实现了这两个方法。

2、用pthread的mutex来给mktime和localtime_r加锁,但是这样要使用pthread库,移植性不够好。


    gettimeofday()这个syscall用来供用户获取timeval格式的当前时间信息(精确度为微秒级),以及系统的当前时区信息(timezone)。结构类型 timeval的指针参数tv指向接受时间信息的用户空间缓冲区,参数tz是一个timezone结构类型的指针,指向接收时区信息的用户空间缓冲区。这 两个参数均为输出参数,返回值0表示成功,返回负值表示出错。
   

首先来看一下spin_lock机制。spin_lock机制和semaphore机制解决的都是两个进程的互斥问题,都是让一个进程退出临界区后另一个进程才进入的方法,不过sempahore机制实行的是让进程 暂时让出cpu,进入等待队列等待的策略,而spin_lock实行的却是却进程在原地空转,等着另一个进程结束的策略。

    gettimeofday()代码中的read_lock_irqsave(lock, flags)以及read_lock_irq(lock), read_lock_bh(lock) 和 write_lock_irqsave(lock, flags) , write_lock_irq(lock), write_lock_bh(lock)都是spin_lock的一个小小的变型,而Spin_lock采用的方式是让一个进程运行,另外的进程忙等待,由于在只有一个cpu的机器(UP)上微观上只有一个进程在运行。因此gettimeofday()也不是线程安全的系统调用。
posted on 2013-01-05 09:18  智慧的老鸟  阅读(10048)  评论(0编辑  收藏  举报