摘要: 前言 文字型pdf提取,python的库一大堆,但是图片型pdf和pdf扫描件提取,还是有些难度的,我们需要用到OCR(光学字符识别)功能。 一、准备 1、安装OCR(光学字符识别)支持库 首先要安装pytesseract和Tesserac OCR,Tesseract OCR是一种广泛使用的OCR工 阅读全文
posted @ 2023-12-17 15:35 爱吃雪糕的小布丁 阅读(794) 评论(0) 推荐(0) 编辑