文件读取与存储

pandas的API支持众多的文件格式，如CSV、SQL、XLS、JSON、HDF5。

CSV

pandas.read_csv(filepath_or_buffer, sep =',' )
- filepath_or_buffer:文件路径
- usecols:指定读取的列名，列表形式
- sep-分割字符默认','

# 读取文件,并且指定只获取'open', 'close'指标
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])

HDF5

HDF5文件的读取和存储需要指定一个键，值为要存储的DataFrame

从h5文件当中读取数据

pandas.read_hdf(path_or_buf，key =None，** kwargs)
- path_or_buffer:文件路径
- key:读取的键
- return:Theselected object
DataFrame.to_hdf(path_or_buf, key, \kwargs)
- key:指定保存的键名

JSON

read_json—读取文件
- orient--指定读取数据的字典格式
- records—一行一个记录
- lines—是否分行--一个记录一行
DataFrame.to_json(path_or_buf=None, orient=None, lines=False)
- 将Pandas 对象存储为json格式
- path_or_buf=None：文件地址
- orient:存储的json形式，
- lines:一个对象存储为一行
to_json--存储文件—注意:lines=True

优先选择使用HDF5文件存储

posted @ 2019-09-08 21:46 太虚真人阅读(460) 评论(0) 编辑收藏举报

刷新页面返回顶部

今天最重要的事做了多少？