python对excel文件中指定表格的指定列数据进行去重复操作。
import pandas as pd # 读取Excel文件 df_all = pd.read_excel('域名管理系统.xlsx', sheet_name=None, engine='openpyxl') # 确保'01流水'表存在 if '01流水' in df_all: # 提取第1列第2行至第1000行的数据并去重 df_two = df_all['01流水'] unique_data = df_two.iloc[1:1000, 0].drop_duplicates().reset_index(drop=True) # 检查并处理'01流水-去重'表 if '01流水-去重' in df_all: # 删除原有的'01流水-去重'表 del df_all['01流水-去重'] # 将去重后的数据添加为新的'01流水-去重'表 df_all['01流水-去重'] = unique_data # 保存更新后的Excel文件 with pd.ExcelWriter('域名管理系统.xlsx', engine='openpyxl') as writer: for sheet_name, data_frame in df_all.items(): data_frame.to_excel(writer, sheet_name=sheet_name, index=False) else: print("Sheet '01流水-去重' not found in the Excel file.")
上述代码由阿里云lingma完成。
功能:将one.xlsx文件中表two中第1列第2行至1000行的数据进行去重,并将结果保存到two-uni表格,如果two-uni已存在,则删除原表格。
需要:我们可以使用pandas
库来处理Excel文件。
pip install pandas openpyxl