python多文件合并
import pandas as pd #1.记录文件夹路径 2.将原表格构建到新表格中 3.找到所有需要合并的表,写进新表格 import os file_dir = 'C:\\数据分析\\个人实操\\python数据视图\\实操作业一 多文件合并\\数据源\\folder' #文件路径 new_filename = file_dir + '\\new_file.xlsx' #构建新的表格名称 file_list = os.listdir(file_dir) #找到文件路径下的所有表格名称,返回列表 new_list = [] for file in file_list: file_path = os.path.join(file_dir,file) #重构文件路径 print(file_path) dataframe = pd.read_excel(file_path) #将excel转换成DataFrame new_list.append(dataframe) #保存到新列表中 df = pd.concat(new_list) #多个DataFrame合并为一个 df.to_excel(new_filename,index=False) #写入到一个新excel表中
运行报错:
ModuleNotFoundError: No module named 'pandas'
先查看pandas
pip3 show pandas
安装pandas(最后在网络好的时候)
pip3 install pandas
查看是否安装成功
如果还是不能调用,可试下升级pandas
pip3 install --upgrade pip
运行报错
ImportError: Missing optional dependency 'openpyxl'. Use pip or conda to install openpyxl.
安装openpyxl
pip3 install openpyxl
运行成功!!!!