python中时间戳的探索
声明
本文章只针对python3.6及以上版本。
问题提出
首先,我们先import一些必要模块:
In [1]: from datetime import datetime, timezone, timedelta
接下来,看下面这一段令人疑惑的代码:
In [2]: dt = datetime(1970, 1, 1, 0, 0)
In [3]: print(dt)
1970-01-01 00:00:00
In [4]: dt.timestamp()
---------------------------------------------------------------------------
OSError Traceback (most recent call last)
<ipython-input-4-76b27e848bf3> in <module>()
----> 1 dt.timestamp()
OSError: [Errno 22] Invalid argument
In [5]: dtime = datetime(1970, 1, 2, 8, 0)
In [6]: print(dtime)
1970-01-02 08:00:00
In [7]: dtime.timestamp()
Out[7]: 86400.0
首先,我们知道,在计算机中,时间实际上是用数字表示的。我们把1970年1月1日 00:00:00 UTC+00:00时区的时刻称为epoch time,记为0(1970年以前的时间timestamp为负数),当前时间就是相对于epoch time的秒数,称为timestamp。
这里,我构建了一个“1970年1月1日 00:00:00”的时间,按照理解,这个时间的timestamp
应该是0
.但从输出可以看到,出现了OSError
错误。
经过一点点探索,我发现,能够以上面方式输出timestamp的最小时间是“1970年1月2日 08:00:00”,也就是说,如果dtime = datetime(1970, 1, 2, 7, 0)
时,dtime.timestamp()
也会引起OSError
错误。
我十分疑惑的地方有三个:
- 为什么
In [4]: dt.timestamp()
会出现错误? - 为什么能够输出
timestamp
的最小时间是datetime(1970, 1, 2, 8, 0)
? - 为什么
In [7]: dtime.timestamp()
的输出是24小时,而不是24+8小时?
显式加入时区看一看
从In [3]: print(dt)
的输出来看,我们发现,用类似于datetime(1970, 1, 1, 0, 0)
这样的语句,是隐式采用系统所在时区的。现在,我们来显式指定时区:
In [8]: dt0 = dt.replace(tzinfo = timezone(timedelta(hours = 0)))
In [9]: print(dt0)
1970-01-01 00:00:00+00:00
In [10]: dt0.timestamp()
Out[10]: 0.0
In [11]: dt8 = dt.replace(tzinfo = timezone(timedelta(hours = 8)))
In [12]: print(dt8)
1970-01-01 00:00:00+08:00
In [13]: dt8.timestamp()
Out[13]: -28800.0
In [14]: dt_8 = dt.replace(tzinfo = timezone(timedelta(hours = -8)))
In [15]: print(dt_8)
1970-01-01 00:00:00-08:00
In [16]: dt_8.timestamp()
Out[16]: 28800.0
这里,需要说一下背景知识:
以伦敦格林尼治天文台所在为本初子午线,定为零时区(中时区)。向东为+时区,向西为-时区。
replace函数显式地强制地将时区转换为tzinfo
参数所指定地时区。此时,你应该注意In [12]: print(dt8)
的输出,dt8是从dt转换过来地,dt是1970-01-01 00:00:00
,dt8也是这个时间,但后面多了一点东西:+08:00
我用dt8
表示东八区,即北京所在时区,用dt0
表示中时区,即伦敦所在时区,用dt_8
表示西八区。
好了,来解释代码:
- 我们从
In [9]: print(dt0)
的输出中看到+00:00
,这代表dt0的意思是中时区的1970-01-01 00:00:00,我们都知道,timestamp
是相对于epoch time
的秒数,Out[10]: 0.0
证明了这一点。 - 从
In [12]: print(dt8)
的输出中看到+08:00
,这代表dt8的意思是东八区的1970-01-01 00:00:00。东八区比中时区早8个小时,所以,由于timestamp是相对于epoch time
的秒数,所以dt8.timestamp()
应该是-8小时,Out[13]: -28800.0
验证了这一点。 - 接下来的
dt_8
就很容易理解了,和dt8
是一样道理。dt_8
是西八区,比中时区少8小时,所以要加8小时才能“到达”中时区。Out[16]: 28800.0
验证了这一点。
其实,到了这里,我们已经可以解答上面提出的第三个疑惑了:为什么In [7]: dtime.timestamp()
的输出是24小时,而不是24+8小时? **
我们定义的时间是01-02 08:00
,按照惯性思维01-02 08:00
-01-01 00:00
等于24+8小时,没毛病呀?为什么结果不是这样呢?
真正的原因是:
dtime是东八区的时间,换算为中时区的时间应该是1970-01-02 00:00
。所以,1970-01-02 00:00
-1970-01-01 00:00
等于24小时。总之,你要时刻记住:timestamp是相对于epoch time的秒数**。
解决最后的问题
其实,要回答最后的问题,只需要知道一点点东西就够了,那便是显式指定时区和隐式采用系统时区的区别。
我们从回答问题开始:为什么能够输出timestamp
的最小时间是datetime(1970, 1, 2, 8, 0)
?
隐式采用系统所在时区时,类似于dtime.timestamp()
这样的输出不可以有负数。这是为了应对在实际应用中世界各地的时间能够统一。那么,怎么能让timestamp不为负数呢?就是相对于中时区,从1970-01-02 00:00
开始算起,这是中时区的最小时间。这样的话,我无论向东还是向西都不会出现负数。由于,我们用的时北京时间,即东八区,所以,最小时间是1970-01-02 08:00
同样道理,如果我们在东一区,那么我们的最小时间是1970-01-02 01:00
,为了验证,我开了虚拟机,并且把时区调到东一区,下面是输出:
>>> dt = datetime(1970, 1, 2, 1, 0)
>>> print(dt)
1970-01-02 01:00:00
>>> dt.timestamp()
86400.0
现在只剩下最后的问题了:
为什么In [4]: dt.timestamp()
会出现错误?
到了这里,我们可以看官方文档的东西了。我截取官方的一段话:
There is no method to obtain the POSIX timestamp directly from a naive datetime instance representing UTC time. If your application uses this convention and your system timezone is not set to UTC, you can obtain the POSIX timestamp by supplying
tzinfo=timezone.utc
大意是我们无法直接从原生的datetime实例中直接获取代表utc时间的timestamp,你可以通过应用tzinfo=timezone.utc
来获取timestamp。
注意:还记得我们前面说过的这句话吗:
replace函数"显式地"强制地将时区转换为
tzinfo
参数所指定地时区。
这里的原生的datetime实例其实已经隐式地采用了你系统所在时区了。看代码:
>>> dtest = datetime(1970, 1, 2, 8, 0)
>>> dtest1 = dtest.replace(tzinfo = timezone(timedelta(hours = 8)))
>>> dtest.timestamp()
86400.0
>>> dtest1.timestamp()
86400.0
>>> dtest2 = dtest.replace(tzinfo = timezone(timedelta(hours = 0)))
>>> dtest2.timestamp()
115200.0
dtest和dtest1的输出是一样的,这里说明了如果不显式指定系统时区,就隐式采用系统所在时区。这里,建议你往上拉一下,再看一看显式指定和隐式采用系统所在时区的区别。隐式时要从1970-01-02 +时区
算起,即不能出现负数。
现在,我们指定tzinfo的参数,发现dt
能输出了。
In [17]: dt
Out[17]: datetime.datetime(1970, 1, 1, 0, 0)
In [18]: print(dt)
1970-01-01 00:00:00
In [19]: dt.replace(tzinfo = timezone.utc).timestamp()
Out[19]: 0.0
In [20]: dt.timestamp()
---------------------------------------------------------------------------
OSError Traceback (most recent call last)
<ipython-input-20-76b27e848bf3> in <module>()
----> 1 dt.timestamp()
OSError: [Errno 22] Invalid argument
结尾
文章有点啰嗦。要说明的一点是:所谓的显式和隐式是为了帮助我理解概念我自己写的。其实如果你是位很聪明且基础好的人,看到下面这段话就已经全明白了:
Changed in version 3.6: The timestamp() method uses the fold attribute to disambiguate the times during a repeated interval.There is no method to obtain the POSIX timestamp directly from a naive datetime instance representing UTC time. If your application uses this convention and your system timezone is not set to UTC, you can obtain the POSIX timestamp by supplying tzinfo=timezone.utc
版权:保留所有权,转载注明请出处