Linux系统中时间区域和API

1、问题

在开发云平台程序的时候,经常会碰到时间区域转换的问题。比如,任何网络存储的文档的metadata都自己记录了编辑时间。但是,云平台记录时需要把这个时间转成标准时间,便于管理。但是用户使用的时候却是根据他自己的时间来的。比如,

  • 某人需要在北京时间12/31:11:59把新年短信发给女朋友。太早发,太晚发都会惹人不高兴。因此,系统搜索或安排任务的时候,需要根据某个时区,或是新年短信内部时间设定。
  • 再比如,在搜索电邮或短信的时候,根据RFC的定义,时间的搜索需要按照收到时间的字面数值。比如一个电邮的收到时间为Mon, 14 May 2018 23:23:27 -0700,那么搜索1 SEARCH BEFORE 14-May-2018必须返回这个电邮。但是,如果我们在标准时区,当地时间已经是5月15了。

2、概念与API

在最早的Unix中,一台机器只能处理UTC以外的一个时区。时区偏移量和名称字符串(实际上是一对名称字符串,一个用于夏季,一个用于冬季)已配置到内核中,并可供C程序使用。后来(1982)System III通过修改名为TZ的环境变量并调用函数tzset(3),可以设置session时区。从此,解释TZ值区域规范的规则成为POSIX标准的一部分。

V7和较早的BSD Unix有其他各种配置本地时区的方法,这些方法不涉及使用或解释TZ。他们与POSIX TZ的解释有一个相同的致命缺陷,那就是它们不是为了应对时区系统的历史不稳定而设计的。他们无法解释一整套历史位移/ DST的规则,从而正确表达过去本地时间和现在时刻。

在现代Unix系统上,TZ变量可能根本就没有设置,但在任何进程中可以通过明确设置TZ来覆盖系统默认时区。在启动或通过重写值TZ时,可以根据地理位置配置时区指示符(通常但不总是地区/主要城市对),例如“America / New_York”或“Europe / Vienna”或“Asia /台北”。如果标识符是通过TZ设置的,为了与POSIX标准向后兼容,可能需要以冒号开头,以区别于旧式的时区规范。 

基于位置的区域命名方案[IANA-ZONES]由互联网号码分配机构IANA管理。

2.1、Unix中时间日期的格式

作为现在大多数操作系统的鼻祖,Unix中时间日期的format是相当乱的。这也反映了系统发展的历程和不同贡献者的设计偏好:

时间日期

解释

1526924458

Unix UTC seconds

Mon May 21 11:20:32 PDT 2018

date(1) output

2018-05-21 11:23:27-07:00

$ date --rfc-3339=seconds

 

Mon, 21 May 2018 11:23:27 -0700

e-mail RFC-822/RFC-2822 format

Fri, 24 Oct 2014 19:32:27 GMT

HTTP (RFC-2616/RFC-7231) format

20141024192327.000000Z

LDAP (RFC-2252/X.680/X.208) format

2014-10-24 15:32:27

Modified ISO-8601 local time

2014-10-24T15:32:27

Strict ISO-8601 local time

2014-10-24T19:32:27Z

RFC-3339 time, always UTC and marked Z

在用unix程序时,两个使用最多的数据结构是time_t和struct tm,time_t其实就是int32_t,而struct tm的定义如下,我们发现这个结构有个问题,没有时区信息:

struct tm
{
    int    tm_sec;   /* seconds [0,60] (60 for + leap second) */
    int    tm_min;   /* minutes [0,59] */
    int    tm_hour;  /* hour [0,23] */
    int    tm_mday;  /* day of month [1,31] */
    int    tm_mon ;  /* month of year [0,11] */
    int    tm_year;  /* years since 1900 */
    int    tm_wday;  /* day of week [0,6] (Sunday = 0) */
    int    tm_yday;  /* day of year [0,365] */
    int    tm_isdst; /* daylight saving flag */
};

时区是通过环境变量"TZ"来定义的,使之生效需要调用tzset函数,查看时区需要使用tzname:

setenv("TZ", "Australia/Currie", 1);
tzset();
printf ("tz: [%s:%s]\n", tzname[0], tzname[1]);

特别需要注意的是 char * tzname [2]

数组tzname包含两个字符串,它们是用户选择的时区(标准和夏令时)的标准名称。 tzname [0]是标准时区的名称(例如“EST”),tzname [1]是使用夏令时的时区名称(例如“EDT”)。这些对应于来自TZ环境变量的std和dst字符串(分别)。如果从不使用夏令时,则tzname [1]是空字符串。

tzname数组在tzset,ctime,strftime,mktime或localtime被调用时从TZ环境变量初始化。如果使用了多个缩写(例如美国东部时间和东部夏令时的“EWT”和“EDT”),则该数组包含最近的缩写。

tzname数组对于POSIX.1兼容性是必需的,但在GNU程序中,最好使用分解时间结构的tm_zone成员,因为即使它不是最新的缩写,tm_zone也会报告正确的缩写。

2.2、API

  • Unix时间: 
#include <time.h>

/* Obtain current time. */
time_t current_time = time(NULL);

C标准定义time()返回的time_t值不是特定时区的,自1970年1月1日00:00 UTC时刻以来流逝的秒数。使用时不能假设其内部实现,需要使用C标准库中适当的函数(如gmtime和localtime)将time_t转换为struct tm并获得对时间戳细节的访问。  

  • 设置时区:tzset
#include <time.h>
void tzset (void);
extern char *tzname[2]; /* time zone name */
extern long timezone;   /* seconds west of UTC, *not* DST-corrected */
extern int daylight;    /* nonzero if DST is ever in effect here */
  • 获取标准或本地时间
    • gmtime/gmtime_r:获取标准时间,不会修改时区变量
    • localtime/localtime_r:获取本地时间,如果本地时间未设置,会根据地理位置修改时区变量
#include <time.h>
struct tm *gmtime(const time_t *);
struct tm *gmtime_r(const time_t *, struct tm *);
struct tm *localtime(const time_t *);
struct tm *localtime_r(const time_t *, struct tm *);
  • 从本地时间转为Unix时间(秒):mktime
#include <time.h>

time_t mktime(struct tm *tm);

 mktime函数是一个标准函数,是localtime的反函数,将输入本地时间struct tm转换为Unix时间time_t。

  • 其它函数

其它还有辅助函数帮助时间转换为字符串或从字符串转换成时间,因为和时区的关系不大,我们不详细解释。

    • asctime将struct tm对象转换为文本表示(不建议使用)
    • ctime将time_t值转换为文本表示
    • strftime将struct tm对象转换为自定义文本表示
    • wcsftime将struct tm对象转换为自定义宽字符串文本表示

3、用例

 我们有一个已知时间和时区位移,需要输出在该时区的时间,返回值为该天的年月日(yyyyMMdd)。

int timestamp_to_timezonedate(time_t date_timestamp, int32_t tz_offset, char *buf, size_t bufsize) {
    struct tm dat = {0};

date_timestamp += tz_offset * 60;
gmtime_r(&date_timestamp, &dat); if (buf) strftime(buf, bufsize, "%Y-%m-%dT%H:%M:%S", &dat); return ((dat.tm_year+1900) * 10000) + ((dat.tm_mon+1) * 100) + (dat.tm_mday); }

再看看如何获取当前时区和标准时间的差别(分钟):

//return local timezone offset in minutes
int store_local_tz_offset(void) {
    time_t gmt, rawtime = time(NULL);
    struct tm gbuf;

    gmtime_r(&rawtime, &gbuf);

    // Request that mktime() looks up dst in timezone database
    gbuf.tm_isdst = -1;

    //gmt = rawtime - offset 
    //gbuf is used as local tm, therefore gmt will be shifted back with offset
    gmt = mktime(&gbuf);

    //rawtime - gmt
    return (int)difftime(rawtime, gmt)/60;
}

4、One more thing

一般的时区位移是分钟。比如Mon, 21 May 2018 11:23:27 -0700,最后几位是时区位移:[+|-]HHMM。

有些地方的时区位移是半小时,所以为了支持这些地区,在小时后面会有分钟的参数,比如印度 Tuesday 2018-05-22|04:56:39 +0630

 

参考文献

[1]https://www.gnu.org/software/libc/manual/html_node/Time-Zone-Functions.html

[2]http://www.catb.org/esr/time-programming/

posted @ 2018-05-22 06:28  省省吧  阅读(1889)  评论(0编辑  收藏  举报