提取pdf中的表格到excel或csv中

import  pdfplumber
import  pandas

#将表格写进csv文件
#with pdfplumber.open(r'E:\pdf\表格.pdf')  as f:
    #for  page  in f.pages:
        #for table  in page.extract_tables():
            #data=pandas.DataFrame(table[1:],columns=table[0])
            #data.to_csv(r'E:\pdf\表格.csv',mode='a',encoding="ANSI")

#将表格写进excel中不同的工作表
count=1
with  pdfplumber.open(r'E:\pdf\表格.pdf') as f:
    with pandas.ExcelWriter(r'E:\pdf\多个工作表.xlsx')  as w:  #创建多张工作表
        for  page  in f.pages:
            for table  in  page.extract_tables():
                data=pandas.DataFrame(table[1:],columns=table[0])
                data.to_excel(w,sheet_name='{}.xlsx'.format(count))
                count+=1
                

 

posted @ 2020-07-14 11:04  马蹄哒哒  阅读(487)  评论(0编辑  收藏  举报