python对excel文件中指定表格的指定列数据进行去重复操作。

import pandas as pd

# 读取Excel文件
df_all = pd.read_excel('域名管理系统.xlsx', sheet_name=None, engine='openpyxl')

# 确保'01流水'表存在
if '01流水' in df_all:
    # 提取第1列第2行至第1000行的数据并去重
    df_two = df_all['01流水']
    unique_data = df_two.iloc[1:1000, 0].drop_duplicates().reset_index(drop=True)

    # 检查并处理'01流水-去重'表
    if '01流水-去重' in df_all:
        # 删除原有的'01流水-去重'表
        del df_all['01流水-去重']

    # 将去重后的数据添加为新的'01流水-去重'表
    df_all['01流水-去重'] = unique_data

    # 保存更新后的Excel文件
    with pd.ExcelWriter('域名管理系统.xlsx', engine='openpyxl') as writer:
        for sheet_name, data_frame in df_all.items():
            data_frame.to_excel(writer, sheet_name=sheet_name, index=False)
else:
    print("Sheet '01流水-去重' not found in the Excel file.")

上述代码由阿里云lingma完成。

功能:将one.xlsx文件中表two中第1列第2行至1000行的数据进行去重,并将结果保存到two-uni表格,如果two-uni已存在,则删除原表格。

需要:我们可以使用pandas库来处理Excel文件。

pip install pandas openpyxl

 

posted @ 2024-06-03 10:40  总统先生  阅读(117)  评论(0编辑  收藏  举报