python多文件合并

import pandas as pd    #1.记录文件夹路径 2.将原表格构建到新表格中  3.找到所有需要合并的表,写进新表格
import os
file_dir = 'C:\\数据分析\\个人实操\\python数据视图\\实操作业一 多文件合并\\数据源\\folder'  #文件路径
new_filename = file_dir + '\\new_file.xlsx'  #构建新的表格名称
file_list = os.listdir(file_dir)   #找到文件路径下的所有表格名称,返回列表
new_list = []

for file in file_list:
  
    file_path = os.path.join(file_dir,file)     #重构文件路径
    print(file_path)
    
    dataframe = pd.read_excel(file_path)   #将excel转换成DataFrame
    
    new_list.append(dataframe)   #保存到新列表中
  
df = pd.concat(new_list)   #多个DataFrame合并为一个
df.to_excel(new_filename,index=False)    #写入到一个新excel表中

  运行报错:

ModuleNotFoundError: No module named 'pandas'
先查看pandas
pip3 show pandas

 

安装pandas(最后在网络好的时候)

pip3 install pandas

 

 

 查看是否安装成功

 

 

 

如果还是不能调用,可试下升级pandas

pip3 install --upgrade pip

  

 运行报错

ImportError: Missing optional dependency 'openpyxl'.  Use pip or conda to install openpyxl.
 安装openpyxl
pip3 install openpyxl

 

 运行成功!!!!

 

 

  

posted @ 2022-05-17 22:02  yimu-yimu  阅读(657)  评论(0编辑  收藏  举报