金融量化学习---Python, MySQL, Pandas

这里用来记录一些在金融领域,尤其是银行相关的资金、债券、票据中应用到的数据管理与分析, 编程等心得或笔记,以及个人的一点小小兴趣(易经八卦、藏密禅修)等

导航

导入excel,csv的N种方式

方法一:将表中的某一列按str/date读入

file_path =  r'F:\Data Store\20089交易清单' 
file_name ='RB30A1-0900042.xls'
df = pd.read_excel(file_path +'\\'+  file_name, dtype={'交易机构':str}, parse_dates = ['交易日','到期日'], header =2)
df.drop(df.index[-1],axis=0,inplace=True)   #删除最后一行的无用数据

读为日期的同时,还要设定好日期的格式的办法:

dateparse = lambda dates: pd.datetime.strptime(dates, '%Y-%m-%d %H:%M')
datapd=pd.read_csv("D:\data.csv",pares_dates=['Day'],index_col='Day',data_parser=dataparse)

方法二:挑选有用的列导入

bill_list = pd.read_csv(file1_path, usecols=(0,4,9,17), header=0)
#usecols("票号", "票面金额(元)","票面到期日","承兑行"),注意cols从0开始数. bill_list是一个data_frame
bill_list.drop(bill_list.index[-2:],axis=0,inplace=True)    #index[-2:]表示倒数的2行,这里删除最后两行的文字数据

方法三:通过xlrd强制转码

import xlrd
import pandas as pd
workbook = xlrd.open_workbook(file_path +'\\'+ file_name, encoding_override='gb2312') 
pd.read_excel(workbook, header =0)

方法四:指定sheet1

jsh_list =pd.read_excel(file_path +'\\'+  file_name,'sheet1',header =2)

posted on 2021-01-05 16:03  chengjon  阅读(605)  评论(0编辑  收藏  举报