摘要: 最近找到一个收集OFD工具的网站,里面收集了很多的OFD文件的工具和文档,还是挺丰富的,记录一下以后有用 阅读全文
posted @ 2024-08-03 22:05 乌拉小考 阅读(3) 评论(0) 推荐(0) 编辑
摘要: pdf.js中的字体加载流程,下面演示一种Type1的字体的加载流程,会把一些兼容性的内容省去,只记录字体数据的加载过程中涉及到的方法和作用: evaluator.js -> handleSetFont:操作符列表中加载字体 evaluator.js -> loadFont:加载字体的方法 eval 阅读全文
posted @ 2024-07-12 15:00 乌拉小考 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 当我们需要对PDF的文档进行解析的时候,需要对文档结构进行查看并分析,那么这个时候可以使用apache的工具pdfbox-app-***.jar来运行,先看效果 例如我们要查看PDF中的某个字体的数据,那么打开之后可以看到 不仅包含了字体显示的效果,还能查看二进制代码进行分析,因为通过PDF导出的字 阅读全文
posted @ 2024-06-19 09:54 乌拉小考 阅读(13) 评论(0) 推荐(0) 编辑
摘要: pdf.js自带有部分功能debug的工具,可以不用再源码里面,直接再url路径里面通过设置打开 要在pdf.js中传入自带的debug功能,需要在url的后面通过#号跟功能的id即可,例如下面开启所有debug功能,那么就在url后面添加#pdfbug=all即可 下面这个图是pdf.js的wik 阅读全文
posted @ 2024-06-14 18:09 乌拉小考 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 由于要部署stirling-pdf需要docker环境,所以需要使用ubuntu系统,那么在win10/win11上最方便的方式就是使用wsl安装ubuntu然后再wsl上的ubuntu上进行部署,接下来就是整个步骤 在windows上使用wsl安装ubuntu,在powershell上使用wsl 阅读全文
posted @ 2024-05-23 11:25 乌拉小考 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 在开发完成之后需要部署我们的网站项目,那么步骤如下: 打包vue项目,使用npm run build将vue项目打包成dist的文件夹下面,然后将dist文件夹压缩方便上传到服务器 将dist.zip上传到阿里云的文件夹下面,默认情况是上传到 /var/www下面,在不配置nginx的情况下,默认情 阅读全文
posted @ 2024-05-20 10:21 乌拉小考 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 在pdf.js中显示pdf内容和选择pdf文字属于不同的层,一个是canvas绘制,一个是使用dom进行布局,那么接下来先看一下在textLayer中的文字节点div是怎么计算每段文字的布局位置的吧。 首先找到pdf.js源码中的text_layer.js文件,然后得到下面方法appendText方 阅读全文
posted @ 2024-05-07 16:59 乌拉小考 阅读(94) 评论(0) 推荐(0) 编辑
摘要: 首先来一张总结的图,也就是pdf.js在解析和渲染pdf的一个时序图,下图: 首先要明白,pdf.js在渲染pdf的时候是做分层渲染,也就是时间展现的内容是通过canvas进行绘制的,而我们通过鼠标进行选择时候的内容是通过dom进行普通渲染,也就是 <div>123</div> 这样的普通组件,只是 阅读全文
posted @ 2024-05-06 14:36 乌拉小考 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 在做ofd的文件解析的时候,会遇到带有这种描述的数组"g 2 2.0 3 g 3 1.2 0.2"。这个字符串通过空格进行分割得到一个["g", 2, 2.0, 3, "g", 3, 1.2, 0.2]这样的数组数据。 这个是以g表示一个数组的开头,包含了2个元素,每个元素都是2.0的数组。整个字符 阅读全文
posted @ 2024-04-30 18:18 乌拉小考 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 这里使用的是 /(.+)\.(\w+)$/ 来匹配文件名,再javascript中这样使用 const fileNameRegex = /(.+)\.(\w+)$/ const fileName = "tag1.filename.txt" let matches = fileName .match( 阅读全文
posted @ 2024-04-25 14:46 乌拉小考 阅读(46) 评论(0) 推荐(0) 编辑