[pandas]从多个文件中构建dataframe
按列从多个文件中构建
假设有两个csv文件,列不相同,需要整合为一个dataframe,使用glob模块:
from glob import glob
import pandas as pd
# glob会返回任意排序的文件名,所以需要sort排序
some_files = sorted(glob('./some*.csv'))
pd.concat((pd.read_csv(file) for file in some_files),axis='columns').head()
按行从多个文件中构建
比如有三天的股票数据,文件名都是stocks开头的csv文件,维度相同。需要将每个CSV文件读取成DataFrame,将它们结合成一个DataFrame。
from glob import glob
import pandas as pd
# glob会返回任意排序的文件名,所以需要sort排序
some_files = sorted(glob('./stocks*.csv'))
pd.concat((pd.read_csv(file) for file in stock_files), ignore_index = True)
本文来自博客园,作者:花酒锄作田,转载请注明原文链接:https://www.cnblogs.com/XY-Heruo/p/16042226.html