文件夹表格提取与合并py

文件夹表格提取与合并py

  • 把文件夹中提取表格

    import os
    import shutil
    
    
    def extract_tables(source_folder, target_folder):
        """
        从源文件夹及其子文件夹中提取表格文件(Excel文件)到目标文件夹
        :param source_folder: 源文件夹路径
        :param target_folder: 目标文件夹路径
        """
        if not os.path.exists(target_folder):
            os.makedirs(target_folder)
        for root, dirs, files in os.walk(source_folder):
            for file in files:
                if file.endswith(('.xlsx', '.xls')):
                    source_file_path = os.path.join(root, file)
                    target_file_path = os.path.join(target_folder, file)
                    shutil.copy2(source_file_path, target_file_path)
    
    
    # 使用示例,将下面的路径替换为你实际的源文件夹和目标文件夹路径
    source_folder_path = r'D:\LIJIAN\Desktop\2024年(1)'
    target_folder_path = r'D:\LIJIAN\Desktop\2024'
    extract_tables(source_folder_path, target_folder_path)
    
  • 把文件夹中多个表格汇总成一个表格

    import warnings
    import pandas as pd
    import os
    import glob
    import openpyxl
    
    # 忽略关于openpyxl数据验证扩展不支持的警告
    warnings.filterwarnings("ignore", category=UserWarning, message="Data Validation extension is not supported and will be removed")
    
    # 文件夹路径,替换为实际存放表格文件的文件夹路径,这里使用原始字符串避免转义问题
    folder_path = r'D:\LIJIAN\Desktop\a'
    
    # 获取文件夹下所有Excel文件的路径
    excel_files = glob.glob(os.path.join(folder_path, '*.xlsx'))
    
    # 用于存储读取的每个Excel文件数据
    dataframes = []
    
    for file in excel_files:
        df = pd.read_excel(file)
        dataframes.append(df)
    
    # 合并所有数据
    merged_df = pd.concat(dataframes, axis=0, ignore_index=True)
    
    # 保存合并后的数据到新的Excel文件,可根据需求修改文件名
    merged_df.to_excel(os.path.join(folder_path,'merged_file.xlsx'), index=False)
    
posted @   1999LIJIAN  阅读(12)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示