摘要: 问题: 环境:Ubuntu18.04,电子发票PDF文档 原因:未明确问题原因,只能确定是pdfminer针对中文字体重新编译安装后才该错误(如果有大神知道望告知) 解决:修改源码,其实就是做了一层错误过滤 阅读全文
posted @ 2021-11-05 11:18 君君姐 阅读(270) 评论(0) 推荐(0) 编辑
摘要: 问题:部分汉字字体无法解析,出现CID代号 环境:Ubuntu18.04,PDF文件内容必须为文字,图片不支持文字解析(Linux可以打开PDF文件右键,如果有复制图像选项,则该PDF文件内容为图像) 解决:pdfminer需要重新重新编译一下,官方文档首页有提示,针对CJK字体的支持 python 阅读全文
posted @ 2021-11-05 11:03 君君姐 阅读(1750) 评论(0) 推荐(0) 编辑