python时间戳(1)

一、 时间戳定义:其实就是在历史长河中钉了一个钉子,独一无二不说,还可以用一串数字表示

二、 时间戳怎么产生:

  (1) 可以自己输入

    a. 一个是datetime()## 后面所有datetime都可以按下列方式变为timestamp

1 from datetime import datetime
2 import pandas as pd
3 stamp1=datetime.now()
4 stamp=pd.Timestamp(stamp1)
5 stamp.value
1576506889855183000 
   b. 一个是timestamp()
import pandas as pd
stamp2=pd.Timestamp('2019,12,16')
stamp2.value
1576454400000000000

  (2) 可以从文本中分析出来,分析器为parse(中文解释:做句法分析)

from dateutil.parser import parse
parse('2019-12-10')
datetime.datetime(2019, 12, 10, 0, 0)
年 月 日 小时 分钟
如果不是12月10日而是10月12日呢?
from dateutil.parser import parse
parse('2019-12-10',dayfirst=True)
datetime.datetime(2019, 10, 12, 0, 0)
文本写出花来了怎么变成我想要的日期格式?你告诉它什么是什么就好了
但这需要对基本的日期表达进行说明:
%Y 2019(四位数年份)
%y 19(二位数年份)
%m 12(月份)
%d 16(日期)
%H 15(24小时制)
%I 3(12小时制)
%M 06(分钟)
%S 14(秒)
%w 星期几(0是星期天,6是星期一)
%U 一年中第几个星期(从00到53),以星期天为一周的第一天
%W 一年中第几个星期(从00到53),以星期一为一周的第一天
%z 时区
%F 2019-12-16
%D 12/16/2019
from datetime import datetime
try_trans='2019#12#10'
datetime.strptime(try_trans,'%Y#%m#%d') ## 分开看是:str(文本) p(变) time(时间)
datetime.datetime(2019, 12, 10, 0, 0)
建议可以直接用parse试一下,基本上python都可以解析
from dateutil.parser import parse
parse('DEC 16,2019 15:02')
datetime.datetime(2019, 12, 16, 15, 2)

三、 时间戳的移动:其实就是拨动手表指针的工作后重新变了一个新的钉子

  (1) 重新找个钉子一次性到位(DateOffset)

    首先看看DateOffset(里面可以加什么频率?)     

 |      - years
 |      - months
 |      - weeks
 |      - days
 |      - hours
 |      - minutes
 |      - seconds
 |      - microseconds
 |      - nanoseconds

 

from pandas.tseries.offsets import * #关键词分开:t series时间序列/off sets 参照系、定位
now=datetime.now()        ##datetime.datetime(2019, 12, 16, 16, 15, 2, 561839)
now+DateOffset(days=3)#天数相加  Timestamp('2019-12-19 16:34:35.850953')
now+DateOffset(months=3)#月数相加 Timestamp('2020-03-16 16:10:58.030667')

(2) 先定位后滚动 --此方法只能对前一个后一个进行操作
  首先看看有哪些定位?
先把日期点挪到前、中、后,再滚动
| - SemiMonthEnd | - MonthEnd | - WeekOfMonth | - QuarterEnd | - BQuarterEnd | - YearEnd | - BYearEnd |
| - SemiMonthBegin| - MonthBegin| - LastWeekOfMonth| - QuarterBegin| - BQuarterBegin | - YearBegin| - BYearBegin |
##定位
offset=MonthEnd() #月底
## 滚动
offset.rollforward(now) #本月月底 Timestamp('2019-12-31 16:34:35.850953')
offset.rollback(now)#上个月月底 Timestamp('2019-11-30 16:34:35.850953')

##定位
offset=SemiMonthEnd()#月半、月中
##滚动
offset.rollforward(now)#月半、月中到底就是月底 Timestamp('2019-12-31 16:34:35.850953')
offset.rollback(now)# 月半到头就是月中 Timestamp('2019-12-15 16:34:35.850953')

##定位
offset=WeekOfMonth()#位于星期几
##滚动
offset.rollforward(now)#本月第一周的星期几 Timestamp('2020-01-06 16:34:35.850953')
offset.rollback(now)#下个月第一周的星期几 Timestamp('2019-12-02 16:34:35.850953')

##定位
offset=LastWeekOfMonth()#位于星期几
##滚动
offset.rollforward(now)#本月最后一周的星期几 Timestamp('2019-12-30 16:34:35.850953')
offset.rollback(now)#下个月最后一周的星期几
Timestamp('2019-12-02 16:34:35.850953')
(3) 根据习惯日期定位方式定位
首先看看有哪些定位?之前运用的都可以,加上数字即可
| - SemiMonthEnd  | - MonthEnd  | - WeekOfMonth    | - QuarterEnd  | - BQuarterEnd   | - YearEnd  | - BYearEnd   | 
| - SemiMonthBegin| - MonthBegin| - LastWeekOfMonth| - QuarterBegin| - BQuarterBegin | - YearBegin| - BYearBegin |
| - Hour | - Minute | - Second | -

now+MonthEnd(2) #往后挪两个月,这弥补了之前无法定位到当前月的下个月问题 Timestamp('2020-01-31 16:34:35.850953')

注意:错误示范

offset=MonthEnd(2)
offset.rollforward(now) #结果仍然为  Timestamp('2019-12-31 16:34:35.850953'),想要达到2020年1月只能用加的方式

注意:通常情况下我们一般不单独做时间序列单列,都会跟一些数据,也就是series和dataframe,可以使用shift进行日期变更

 

四、在两个时间点内按要求添加数据

  这个功能就相当于range(a,b),所以公式也很像date_range(start='开头日期’,end='结尾日期‘,periods=递增几次,freq='频率')

  1. date_range(‘开头日期‘,n)

  从开头日期开始一天一天的列出n天

  2. date_range(‘开头日期‘,递增几次,频率)

  频率有以下几种表示方式:

  a. 天以内

  | - 2(按2天递增) |-‘3B’(按3天工作日递增)| - ‘4h’(按四个小时递增) | - '50min'(按五十分钟递增)

  | - '6S'(按六秒递增)| - ‘7ms’(按七毫秒递增)|-‘8U’(按八微秒递增)| - ‘2D4h50min6S7ms8U’ (可以连着写)

 

pd.date_range('2019-12-16',periods=5,freq='2D4h50min6S7ms8U')
DatetimeIndex(['2019-12-16 00:00:00', '2019-12-18 04:50:06.007008',
               '2019-12-20 09:40:12.014016', '2019-12-22 14:30:18.021024',
               '2019-12-24 19:20:24.028032'],
              dtype='datetime64[ns]', freq='190206007008U')

  b. 周以内

  | - ‘W-TUE’(从开头日期的当天开始,往后第一个星期二开始,按7天递增)

 

pd.date_range('2019-12-16',periods=5,freq='W-TUE')
DatetimeIndex(['2019-12-17', '2019-12-24', '2019-12-31', '2020-01-07',
               '2020-01-14'],
              dtype='datetime64[ns]', freq='W-TUE')

  c. 月以内

  |-'WOM-3FRI'(从开头日期开始月的第3个星期五,按月递增)

pd.date_range('2019-12-21',periods=5,freq='WOM-3FRI') #注意:如果给出的日期超过本月第三个星期五将跳过本月
DatetimeIndex(['2020-01-17', '2020-02-21', '2020-03-20',
               '2020-04-17'],dtype='datetime64[ns]', freq='WOM-3FRI')

  | -‘6M’(从开头日期的当月月底开始,按六个月递增)| - ‘6BM’(从开头日期的当月最后一个工作日开始,按六个月递增)

pd.date_range('2019-12-21',periods=5,freq='6M') # 注意:与MS的区别
DatetimeIndex(['2019-12-31', '2020-06-30', '2020-12-31', '2021-06-30',
               '2021-12-31'],
              dtype='datetime64[ns]', freq='6M')
pd.date_range('2018-12-21',periods=5,freq='6BM')
DatetimeIndex(['2018-12-31', '2019-06-28', '2019-12-31', '2020-06-30',
               '2020-12-31'],
              dtype='datetime64[ns]', freq='6BM')

  | -‘7MS ’(从开头日期的当月月初开始,按七个月递增)| -‘7BMS’(从开头日期的当月第一个工作日开始,按七个月递增)

pd.date_range('2018-12-21',periods=5,freq='7MS') # 注意:如果给定的日期不是月头开始,那么结果会从下个月月初开始,按七个月递增
DatetimeIndex(['2019-01-01', '2019-08-01', '2020-03-01', '2020-10-01',
               '2021-05-01'],
              dtype='datetime64[ns]', freq='7MS')
pd.date_range('2018-12-21',periods=5,freq='7BMS')
DatetimeIndex(['2019-01-01', '2019-08-01', '2020-03-02', '2020-10-01',
               '2021-05-03'],
              dtype='datetime64[ns]', freq='7BMS')

  d. 季度以内

  | - ‘Q-FEB’(从二月月底开始,按三个月递增)|-‘QS-FEB’(从二月月头开始,按三个月递增)

  | - 'BQ-FEB'(从二月最后一个工作日开始,按三个月递增)|-  'BQS-FEB'(从二月第一个工作日开始,按三个月递增)

pd.date_range('2018-12-01',periods=5,freq='BQ-FEB') 
# Q和QS没什么注意点,但BQ和BQS需要注意,如果给定的日期已经过了当年二月,则系统会从下月的二月开始显示
DatetimeIndex(['2019-02-28', '2019-05-31', '2019-08-30', '2019-11-29',
               '2020-02-28'],
              dtype='datetime64[ns]', freq='BQ-FEB')

  e. 年以内

  | - 'A-FEB'(从开头年份的二月底开始,按年递增)| - ‘BA-FEB’(从开头年份的二月最后一个工作日开始,按年递增

  | - ‘AS-FEB’(从开头年份的二月初开始,按年递增)| - ‘BAS-FEB’(从开头年的二月第一个工作日开始,按年递增)

pd.date_range('2018-12-01',periods=5,freq='AS-FEB') #同上
DatetimeIndex(['2019-02-01', '2020-02-01', '2021-02-01', '2022-02-01',
               '2023-02-01'],
              dtype='datetime64[ns]', freq='AS-FEB')
-----------------
前文中我们看到有些日期已经超过导致递延问题,那么我们如何解决这类问题?
我们可以提取年、月来避免
  • 比如前文中pd.date_range('2018-12-01',periods=5,freq='BQ-FEB') 中的问题从年初开始
import pandas as pd
startDate="2018-12-01"
startDateYear=str(pd.to_datetime(startDate).year)
pd.date_range(startDateYear,periods=5,freq='AS-FEB')
DatetimeIndex(['2018-02-01', '2019-02-01', '2020-02-01', '2021-02-01',
               '2022-02-01'],
              dtype='datetime64[ns]', freq='AS-FEB')
  • 比如前文中pd.date_range('2019-12-21',periods=5,freq='WOM-3FRI') 中的问题从月初开始
import pandas as pd
startDate="2019-12-01"
startDateYear=str(pd.to_datetime(startDate).year)
startDateMonth=str(pd.to_datetime(startDate).month)
year_month=startDateYear+'-'+startDateMonth
pd.date_range(year_month,periods=5,freq='WOM-3FRI') 
DatetimeIndex(['2019-12-20', '2020-01-17', '2020-02-21', '2020-03-20',
               '2020-04-17'],
              dtype='datetime64[ns]', freq='WOM-3FRI')

  3. date_range(‘开头日期‘,‘结束日期’,频率)

  4. date_range('开头日期‘,‘结束日期’,递增几次)

    按天数等分

 


 


posted @ 2019-12-16 21:03  ttkk89  阅读(1785)  评论(0编辑  收藏  举报