随笔 - 100  文章 - 0  评论 - 662  阅读 - 36万 

有不少用户反映,部分老 PDF 文件由于在制作时没有嵌入字库,导致该文件在某些阅读器上显示为乱码。即使他们用 Acrobat 嵌入了相应的字库,文件仍然无法正确显示。

这些老 PDF 看起来具有如下相似的特征:

1、没有嵌入字库,使用的字库有:宋体、楷体_GB2312、仿宋_GB2312 和黑体。

2、在输出文本指令中使用 GB2312 而不是字库的字符映射值(CID)输出文本,因此,嵌入字体后,由于文本输出指令错误,所以仍然无法被常规阅读器正确显示。

3、在兼容这些文档的阅读器(如 Foxit、SumatraPDF)中复制文本时,每个字符之后都附有一个空格,影响了复制的效果。

经过了一段时间的研发,PDF 补丁丁的新测试版将可完美嵌入这些文档所需的字库(仅嵌入文档中使用的字符),在任何支持 PDF 标准的阅读器上均可正常阅读。文本中多余的空格也将被删除,复制时再不会出现多余的空格。

posted on   PDF补丁丁  阅读(1017)  评论(9编辑  收藏  举报
编辑推荐:
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
阅读排行:
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库
历史上的今天:
2011-09-07 PDF补丁丁0.3.3.9测试版(新增 PDF 文档结构探查器)
点击右上角即可分享
微信分享提示