1. 合并1——文件格式完全相同之全部合并
#导入工具包 import pandas as pd import os # 新建空列表,用来存储所有的列表数据 df_list = [] # 循环读取Excel/csv/txt等文件 for i in os.listdir('./'): # 遍历当前代码所在文件,可提供具体文件夹路径 if i.split('.')[-1] == 'xlsx': # 确认是否为excel文件 df = pd.read_excel(i) df_list.append(df) # 拼接全部的DataFrame df = pd.concat(df_list, ignore_index=True) # 写入Excel df.to_excel('./合并文件.xlsx', index=False)
2.合并2——文件内容有一对一的主键合并
## 导入工具包 import pandas as pd ## 读取 Excel 表 df_1 = pd.read_excel('./产品销售情况数据_前几列.xlsx', sheet_name='sheet1') df_2 = pd.read_excel('./产品销售情况数据_后几列.xlsx',sheet_name='sheet1') # sheet_name定义为excel中sheet的name ## 横向拼接两张表 df = pd.merge(df_1,df_2,on='订单编号', sort=True) # 订单编号为一对一主键,输出按主键排序输出 ## 拼接方式inner、outer、left_on、right_on df = pd.merge(df_1,df_2,how='inner',left_on='编号1',right_on='编号2') ## 写入 Excel df.to_excel('./产品销售情况数据_合并.xlsx', index=False)
3. 拆分——文件内容一致,按某一name区分拆分
## 导入工具包 import pandas as pd ## 读取 Excel df = pd.read_excel('./产品销售情况数据.xlsx') ## 获取产品列表 products_list = df['name1'].drop_duplicates() ## 循环筛选写入 Excel 表 for i in products_list: df[df['name1'] == i].to_excel('./产品销售情况数据_'+ i +'.xlsx',index=False)
分类:
0801.数据分析之基础
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix