pandas读取表格智能跳过表头
1. 找到表头所在行
我们可以通过表头字段来判断表头所在行,即先逐行读取内容然后合并成字符串,接着判断某特定内容是否在字符串内,如果在则判定为表头所在行。
2. 读取表格跳过表头
在上一步我们知道了表头所在的位置,使用 pandas.read_excel() 的时候指定表头或跳过即可。
我们以表头包含“票据包号”和“子票区间”字段为例,最终代码:
import pandas as pd
def find_table_header_index(df: pd.DataFrame) -> int:
"""找到表头所在行"""
for index, row in df.iterrows():
row_str = ",".join(str(x) for x in row.to_list())
if "票据包号" in row_str and "子票区间" in row_str:
return index
return -1
def demo1():
filename = "./查重数据.xlsx"
df = pd.read_excel(filename, header=None)
index = find_table_header_index(df)
df = pd.read_excel(filename, skiprows=index)
有了计划记得推动,不要原地踏步。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~
2021-07-07 Java1.8API大类
2021-07-07 如何查看windows电脑信息(win10)