一、pandas其他使用
引用panda库中的dateutil字库中的函数
二、案例
import dateutil import pandas as pd import datetime from dateutil import parser #pandas-时间处理对象 print(dateutil.parser.parse('2001-01-01')) print(dateutil.parser.parse('2020/01/02')) print(dateutil.parser.parse('2020-JAN-03')) dt1=dateutil.parser.parse('2001-01-01') print("------------------1---------------------") #转换为相同的时间格式 dt=pd.to_datetime(['2001-01-01','2021/Feb/02']) print(dt) print("-------------------2--------------------") #默认生成时间段 dt=pd.date_range('2010-01-01','2010-05-01') print(dt) print("------------------3---------------------") #指定生成时间的天数 dt=pd.date_range('2010-01-01',periods=30) print(dt) print("------------------4---------------------") #按小时划分H,星期W,非周六日B dt=pd.date_range('2010-01-01',periods=10,freq='H') print(dt) print("------------------5---------------------")
#生成时间序列 import numpy as np sr=pd.Series(np.arange(50),index=pd.date_range('2010-01-01',periods=50)) print(sr) print("------------------1---------------------") #截取响应的数值 print(sr['2010-02']) print("------------------2---------------------") print(sr['2010-02-02':'2020-02-10']) print("------------------3---------------------") #每一周取和 print(sr.resample('m').sum()) print("------------------4--------------------")
三、文件读取
1、读取CSV文件,同时也可以支持json,html,excel,数据库等
pd.read_csv('文件名',index_col='指定为索引的列名',date_parser=True)#date_parser=True表示将文件中所有表示时间的字符串转换成时间对象,也可以指定列转换为时间对象
pd.read_csg('文件名',header=None,names=['a','b','c','d','e'],na_values='None')#若没有列索引,header=None会自动生成0,1...,names则可以手动指定列索引名,na_values='None'指定数值类型为nan