C#中DateTime的缺陷与代替品DateTimeOffset的对吧

C#中的DateTime在逻辑上有个非常严重的缺陷:

DateTime d = DateTime.Now;

DateTime d2 = d.ToUniversalTime();

Console.WriteLine("{0}", d);

Console.WriteLine("{0}", d2);

 

var result = (d == d2);

Console.WriteLine("{0}", result);//false

 

var result1 = (d.Equals(d2));

Console.WriteLine("{0}", result1);//false

 

C#交互模式中输入以上代码,可以发现尽管一个是本地时间(d),一个是UTC时间(d2),只是时区不一样,但在这个世界上,应该属于同一个时刻。然而两个时间却不相等

 

原因在于DateTime不存储时区,或者说,只存储了一个模糊的关于时区的字段Kind,它是DateTimeKind枚举类型的,有三种取值:Utc/Local/Unspecified,当取值为Unspecified时,则会有歧义。

 

但我还是要吐槽,如果d.Kindd2.Kind中任意一个是Unspecified,那么d != d2我可以理解。但是上面的d.KindLocald2.KindUtc,如果按照DateTime不存储时区的逻辑,那么这两个统一转换Utc或者Local时,那么它们应该相等,事实上也是如此:

 

var result2 = (d == d2.ToLocalTime());

Console.WriteLine("{0}", result2);//True

 

如果把d的本地时间t1当做9,本地时间所处时区z1当做+8,相应的UTC时间t0当做1UTC时间所处时区z0当做0,对它们做规范化处理:

 

那么 d = t1-z1 = 9 - 8 = 1, d2 = t0 - z0 = 1 - 0 = 1

 

然而 d != d2。这才是它怪异的地方。

 

以东八区为例,在C#交互模式中输入以下代码:

 

DateTime d3 = DateTime.Now;

var result3 = d3.ToLocalTime();

var result4 = d3.ToUniversalTime();

Console.WriteLine("{0}", result3);//2018/3/21 12:23:22

Console.WriteLine("{0}", result4);//2018/3/21 4:23:22

 

可以发现,一个简单的构造函数,开发者心中默认一般都是本地时间,然而它却允许直接创建出一个既非本地时间、也非UTC时间的怪物。

d3转成本地时间时,会把d3作为UTC时间来加8小时。

 

d3转成UTC时间时,却会把d3作为本地时间来减8小时。

 

那么d3到底是本地时间还是UTC时间呢?没人清楚,除非它存在于一个非常小的局部作用域中,并且生命周期极短,这时候我们也许可以假设它为本地时间。

 

然而这个本地时间也依赖于它的运行环境,如果是有几台时区不一致的计算机,阉割了时区信息的DateTime转成字符串在网络中传输到另一个时区(比如隔壁的十一区)的另一台服务器中,解析出来后,所谓的东八区本地时间8点,到了日本,变成了既非本地时间、也非UTC时间的怪物。

 

DateTime在官方文档中已经不推荐使用,而是推荐使用它的代替品DateTimeOffset,后者保存时区信息。

 

在交互模式中验证一下:

 

 var result5 = DateTimeOffset.Now;

var result6 = result5.ToUniversalTime();

var result7 = (result5 == result6);

Console.WriteLine("{0}", result7);//True

 

可以发现,DateTimeoffset判断两个时间是否等价的标准,是以世界时间轴的时刻来判断的,与时区无关,甚至可以与UTC时间无关。只要它们都在同一个时间体系里、能互相变换即可。

 

如果有使用DateTime的,统一换成DateTimeOffset

如果有用到32比特的UNIX时间戳的,统一换成64比特的long来存储UtcTicks

即使项目本身不跨时区,仍然有可能遇到时区问题,比如如果使用了mongodb的,mongodb存储的时候都是统一存成UTC时间的(好像是,忘了),而且一般来说会带有时区信息。但是有一种情况比较糟糕,如果你的DateTimeKindUnspecified的,隐含的时区的信息就会丢失。再取出来之后,就会有8小时的时差。有一些第三方的或者自己公司的类库之类的,如果没有处理好这个问题,也有潜在的时区丢失问题。UNIX时间戳存成Utc Ticks也有好处,无论是精度还是时间跨度,都远超UNIX时间戳。只需要64比特,即可获得下至100纳秒的精度,上超万年的时间跨度,一劳永逸,无论是转回UNIX时间戳还是JS时间戳,都能胜任。空间代价也非常小,除非你的存储空间真的是硬伤。。

posted @ 2018-03-29 16:45  说多了都是泪  阅读(277)  评论(0编辑  收藏  举报