pd.read_excel('foo.xlsx', 'Sheet1', index_col=None, na_values=['NA'])

 

Pandas数据存取
Pandas可以存取多种介质类型数据,例如:内存、文本、CSV、JSON、HTML、Excel、HDF5、SQL等

生成数据

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randn(1000, 4),columns=['A', 'B', 'C', 'D'])

df

 

Pandas存取CSV

写入CSV

df.to_csv('foo.csv')

df.to_csv('foo.csv',index=False) #不保存行索引

 

读取CSV

pd.read_csv('foo.csv')

 

读取CSV其他参数

pd.read_csv(
    'aaa.csv', #文件名
    usecols=[0,1,2,4], #读取指定列
    nrows=10, #读取前几行
    encoding='GBK' #编码,根据文本编码修改,默认utf-8,可以指定为GBK
)


'''
data,time,name,age
20100101,000000,"张三",18
20100101,230000,"李,四",28
'''

x = pd.read_csv(
    'aaa.csv',
    parse_dates={'timestamp': ['data','time']}, #将两列合并解析为时间格式
    index_col='timestamp' #将时间设为行索引
)

 

  • csv文件内有汉字等特殊符号时,csv文件编码应为utf-8(无BOM)可默认正常读取,如果编码是ANSI,加参数encoding='GBK'
  • 数据内有逗号时,左右加英文半角双引号,可以正常解析

Pandas存取HDF5

写入HDF5

df.to_hdf('foo.h5','df')

 

从HDF5读取

pd.read_hdf('foo.h5','df')

 


Pandas存取Excel(xlsx)

写入Excel文件

df.to_excel('foo.xlsx', sheet_name='Sheet1')

 

从Excel文件读取