摘要:
问题: 环境:Ubuntu18.04,电子发票PDF文档 原因:未明确问题原因,只能确定是pdfminer针对中文字体重新编译安装后才该错误(如果有大神知道望告知) 解决:修改源码,其实就是做了一层错误过滤 阅读全文
摘要:
问题:部分汉字字体无法解析,出现CID代号 环境:Ubuntu18.04,PDF文件内容必须为文字,图片不支持文字解析(Linux可以打开PDF文件右键,如果有复制图像选项,则该PDF文件内容为图像) 解决:pdfminer需要重新重新编译一下,官方文档首页有提示,针对CJK字体的支持 python 阅读全文