PyMuPDF框架学习(pdf文本处理)

与其他框架的比较(优势)

This documentation covers PyMuPDF v1.24.2 features as of 2024-04-17 00:00:01.

一、可以支持多种格式

 二、这里不知道是干什么的。

三、支持CJK、OCR

四、兼容多种文档类型与之合并或写入,以及提取和写入PDF上的诸多种元素

 二、实践

一、在PDF的页脚的文字会识别成乱码。

二、提取文字的文字分隔符

 

 

三、提取图片的代码含义

 

 可以以图片的形式保存每一页,也可以将图片转化为GUI对象引用的图片类型

posted @   凯子敏感吗?  阅读(77)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示