Pandas处理时间序列数据

Pandas时序处理中最常见的两种数据类型为datetimetimedelta

flowchart TB datetime --data --> 2024-01-01 datetime --time--> 10:00:00

datetime顾名思义就是既有日期date也有时间time,表示一个具体的时间点(时间戳)。

timedelta则表示两个时间点之间的差,比如2024-01-012024-01-02之间的timedelta即为一天。

  1. pd.to_datetime(),可以将对应的时间列转换为Pandas中的datetime64类型
  2. set_index() 将时间序列设定为索引
  3. 提取出时间/日期的属性

在时序数据处理过程中,经常需要实现下述需求:

  • 求某个日期对应的星期数(2019-06-05是第几周)
  • 判断一个日期是周几(2020-01-01是周几)
  • 判断某一日期是第几季度(2019-07-08属于哪个季度)

当数据中的时间列已经转换为datetime64格式时,仅需调用.dt接口,即可求得想要的结果

Property Description Property Description
year 年份 month 月份
day hour
minute second
date 日期 time 时间
dayofyear 一年中的第几天 weekofyear 一年中的第几周
weekday 一周中的第几天,0对应周一 weekday_name 周几的名称,如周一为Monday
quarter 第几个季度 is_leap_year 是否闰年
  1. resample基于时间groupby操作
posted @ 2024-02-21 09:34  华小电  阅读(25)  评论(0编辑  收藏  举报