PDFBox 介绍
根据官网的介绍可知,PDFBox是一个用来处理PDF文档的开源的Java工具包。这个项目运行创建PDF文档、对已有文档进行操作并且能够从文档中提取内容。它也包含了几个命令行工具。还有一点很重要,它是开源的,我很喜欢这点。这句话是我自己说的。
功能
- 提取文本:从PDF文件中提取(Unicode)文本
- 拆分和合并PDF文档:将一个单独的PDF文件拆分为多个文件或者是将多个PDF文件进行合并。
- 填充表单:从PDF表单中提取数据或者是填充一个PDF表单。
- 预检查:根据PDF标准来校验PDF文件。
- 打印:使用标准的Java打印API来打印一个PDF文件。
- 保存为图片:把PDF文件保存为图片文件,PNG或者JPEG。
- 创建PDF文件:使用内嵌的字体和图片来创建一个PDF文件。
- 签名:对PDF文件的数字签名。