[pandas]从多个文件中构建dataframe

按列从多个文件中构建

假设有两个csv文件,列不相同,需要整合为一个dataframe,使用glob模块:

from glob import glob
import pandas as pd

# glob会返回任意排序的文件名,所以需要sort排序
some_files = sorted(glob('./some*.csv'))
pd.concat((pd.read_csv(file) for file in some_files),axis='columns').head()

按行从多个文件中构建

比如有三天的股票数据,文件名都是stocks开头的csv文件,维度相同。需要将每个CSV文件读取成DataFrame,将它们结合成一个DataFrame。

from glob import glob
import pandas as pd

# glob会返回任意排序的文件名,所以需要sort排序
some_files = sorted(glob('./stocks*.csv'))
pd.concat((pd.read_csv(file) for file in stock_files), ignore_index = True)
posted @ 2022-03-22 23:59  花酒锄作田  阅读(66)  评论(0编辑  收藏  举报