导入excel,csv的N种方式
方法一:将表中的某一列按str/date读入
file_path = r'F:\Data Store\20089交易清单'
file_name ='RB30A1-0900042.xls'
df = pd.read_excel(file_path +'\\'+ file_name, dtype={'交易机构':str}, parse_dates = ['交易日','到期日'], header =2)
df.drop(df.index[-1],axis=0,inplace=True) #删除最后一行的无用数据
读为日期的同时,还要设定好日期的格式的办法:
dateparse = lambda dates: pd.datetime.strptime(dates, '%Y-%m-%d %H:%M')
datapd=pd.read_csv("D:\data.csv",pares_dates=['Day'],index_col='Day',data_parser=dataparse)
方法二:挑选有用的列导入
bill_list = pd.read_csv(file1_path, usecols=(0,4,9,17), header=0)
#usecols("票号", "票面金额(元)","票面到期日","承兑行"),注意cols从0开始数. bill_list是一个data_frame
bill_list.drop(bill_list.index[-2:],axis=0,inplace=True) #index[-2:]表示倒数的2行,这里删除最后两行的文字数据
方法三:通过xlrd强制转码
import xlrd
import pandas as pd
workbook = xlrd.open_workbook(file_path +'\\'+ file_name, encoding_override='gb2312')
pd.read_excel(workbook, header =0)
方法四:指定sheet1
jsh_list =pd.read_excel(file_path +'\\'+ file_name,'sheet1',header =2)