Python 高级技巧:深入解析读取 Excel 文件的多种方法
一、引言
在数据分析和处理中,经常需要从 Excel 文件中读取数据。Python 提供了多种库来实现这个功能,本文将深入探讨使用 pandas
、openpyxl
和 xlrd
库读取 Excel 文件的高级技巧和代码实现。
二、使用 pandas 库读取 Excel 文件
pandas
是 Python 中强大的数据处理库,提供了方便的函数来读取 Excel 文件。
import pandas as pd
# 读取 Excel 文件
df = pd.read_excel('example.xlsx')
# 打印数据框的前几行
print(df.head())
from openpyxl import load_workbook
# 加载工作簿
wb = load_workbook('example.xlsx')
# 获取工作表
sheet = wb.active
# 遍历工作表中的数据
for row in sheet.iter_rows():
for cell in row:
print(cell.value)
import xlrd
# 打开 Excel 文件
workbook = xlrd.open_workbook('example.xls')
# 获取工作表
sheet = workbook.sheet_by_index(0)
# 遍历工作表中的数据
for row_index in range(sheet.nrows):
row_data = sheet.row_values(row_index)
print(row_data)
# 使用 openpyxl 处理合并单元格
from openpyxl import load_workbook
wb = load_workbook('example.xlsx')
sheet = wb.active
merged_cells = sheet.merged_cells.ranges
for merged_cell in merged_cells:
min_row, min_col, max_row, max_col = merged_cell.min_row, merged_cell.min_col, merged_cell.max_row, merged_cell.max_col
top_left_cell_value = sheet.cell(row=min_row, column=min_col).value
for row in range(min_row, max_row + 1):
for col in range(min_col, max_col + 1):
sheet.cell(row=row, column=col).value = top_left_cell_value
# 使用 pandas 分块读取 Excel 文件
import pandas as pd
chunk_size = 1000 # 每次读取的行数
reader = pd.read_excel('large_file.xlsx', chunksize=chunk_size)
for chunk in reader:
# 在这里处理每一块数据
print(chunk)
本文部分代码转自:https://www.wodianping.com/app/2024-10/40486.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本