常用PDF文档开发库
C++库:
1,PDF类库 PoDoFo
http://podofo.sourceforge.net/
PoDoFo 是一个用来操作 PDF 文件格式的 C++ 类库。它还包含一些小工具用来解析、修改和创建 PDF 文
2,Xpdf
http://www.foolabs.com/xpdf/download.html
Xpdf是一个开放源代码的PDF档案浏览器,Xpdf 可解码LZW压缩格式并阅读加密的PDF文件
3,PDF生成工具 Poppler
http://poppler.freedesktop.org/
Poppler 是一个用来生成 PDF 的C++类库,从xpdf 继承而来。它使用了很多先进的类库例如 freetype 和 cairois 来达到更好的输出效果,同时也提供了一组命令行工具包
4, JagPDF
http://www.jagpdf.com/
JagPDF 提供给 C/C++ 和 Python 编程语言用来生成 PDF 文档的库
5, libHaru
http://libharu.org/wiki/Downloads
开源的PDF库
6,CLibPDF
http://hpux.connect.org.uk/hppd/hpux/Shells/ClibPDF-2.02/
ClibPDF是C函数库,可以直接生成PDF文件, 不需要Adobe Acrobat等工具支持.
7,PDF 分页工具llpp
llpp 是基于 MuPDF 的 PDF 分页工具
8,PDF格式分析器 MuPDF
MuPDF是一个PDF格式分析器,用来阅读PDF文件,并创建Fitz trees
MuPDF也有一个API修改PDF文件的内部对象,并写入文件。举例来说,有可能使用加密MuPDF库来对现有的PDF文件重新安排页面
9,PDF文档处理工具包pdftk
Pdftk 是一个简单的命令行工具,用来进行日常的 PDF 文档处理,包括合并、拆分和加密、增加水印、解析PDF元数据、压缩和解压、修复受损的PDF文档等功能。
PDFtk Server 无需 Adobe Acrobat 或 Reader 的支持,可在 Windows, Mac OS X 和 Linux 下允许
10,PDF文档转化工具 pdf2djvu
pdf2djvu 从PDF 文件中解析出图片、文字、超链、书签、元数据等,并生成 DjVu 文件
11,PDF管理工具 PDF chain
PDF Chain 是一个具有图形化用户界面的PDF工具包,提供一种简单的方法来处理 PDF文件,可完成PDF文档的合并、切分、增加背景和附件等操作
12,ePDFView
轻量级基于poppler的PDF阅读器
13,activePDF
PDF开发包(商业)
14,DiffPDF
PDF比较工具
15,PDFSlide
PDF幻灯片展示工具
16,PDFCube
PDFCube 是一个基于 OpenGL 开发的 PDF 阅读器
17,PDFResurrect
PDFResurrect是一个工具,旨在分析PDF文件。 PDF格式可以改变以往的文件中保留较新版本的文件,从而建立一个运行的历史变化的文件。该工具试图提取所有旧的版本,同时也生产简要版本之间的变化
18,QPDF
QPDF 是 PDF 文件转换的命令行工具,也被称为 pdf-to-pdf。QPDF 提供许多对开发者有用的特性
19,GSPdf
GSPdf is a PostScript and PDF Viewer for GNUstep that is based on GhostScript
20,pdftohtml
pdftohtml 可以将 PDF 转化为 HTML ,便于嵌入网页中,并且可以提取 PDF 中的图片
21,pdfpc
pdfpc 是一个支持多显示器的 PDF 文档呈现控制台。基于 GTK 开发
22,PDFEdit
PDFEdit 是一个 PDF 文档编辑器,支持 Windows 和 Linux 系统
23,PDFCrack
PDFCrack用于破解加密PDF文档密码的小工具
24,PDFium
开源的PDF渲染引擎
25,qpdfview
qpdfview是一个基于Qt的PDF阅读器
---------------------------------------------------------------------------------------------------------
JAVA库:
1,PDF操作类库 iText
http://www.lowagie.com/iText/
iText是一个能够快速产生PDF文件的java类库。iText的java类对于那些要产生包含文本,表格,图形的只读文档是很有用的。它的类库尤其与java Servlet有很好
的给合。使用iText与PDF能够使你正确的控制Servlet的输出。
2,PDFBox
http://www.pdfbox.org/
非常强悍的PDF生成和解析Java类库
3,jpedal
http://www.jpedal.org/
jpedal是开源纯Java的PDF文档解析库,可以用来读取PDF文档中的文字、图形。
4,JasperReports
http://jasperforge.org/plugins/project/project_home.php?group_id=102
JasperReports是一个基于Java的开源报表工具,它可以在Java环境下像其它IDE报表工具一样来制作报表。JasperReports 支持PDF、HTML、XLS、CSV和XML文件
输出格式。JasperReports是当前Java开发者最常用的报表工具。
5,Fourfive
http://sourceforge.net/projects/fourfive
Fourfive是一个领先的开源Web报表解决方案,使用XML作为它的配置文件。支持集群、负载平衡、动态发布、PDF, Excel, LDAP,图表、过滤器、排序、布局定制、门户、
JasperReports、Velocity模板、兼容Internet Explorer, Netscape, Mozilla, Opera。
6,FOP
http://xmlgraphics.apache.org/fop/
FOP是由James Tauber发起的一个开源项目,原先的版本是利用xsl-fo将xml文件转换成pdf文件。但最新的版本它可以将xml文件转换成pdf,mif,pcl,txt等多种格式以及
直接输出到打印机,并且支持使用SVG描述图形。
7,JFreeReport
http://sourceforge.net/projects/jfreereport/
JFreeReport是一个用来生成报表的Java类库。它为Java应用程序提供一个灵活的打印功能并支持输出到打印机和PDF, Excel, HTML和XHTML, PlainText, XML和CSV文件
中。
8,YaHP
http://www.allcolor.org/YaHPConverter/
YaHP是一个能够把html文档转换成pdf文档的Java开源包。
9,PDFjet
http://pdfjet.com/os/edition.html
PDFjet是一个用于动态生成PDF文档的Java类库。支持绘制点、线、方框、圆、贝塞尔曲线(Bezier Curves) 、多边形、星形、复杂路径和形状。支持unicode,文本间距调
整,嵌入超链接等。它同时有Java和.NET两个版本。
10,vPDF
http://sourceforge.net/projects/vpdf/
一个将RTF文档转成PDF文档的工具
---------------------------------------------------------------------------------------------------------
.NET组件
1,iTextSharp
http://itextsharp.sourceforge.net/ iTextSharp
是用来生成 PDF 文档的 C# 组件
2,PDFsharp
http://www.pdfsharp.com/
PDFsharp is a C# library that easily creates PDF documents on the fly. The same GDI+ like drawing routines can be used to create PDF documents, draw
on the screen, or send output to any printer. PDFsharp can also modify, merge, and split existing PDF files or incorporate pages from existing PDF files
into new PDF documents.
3,Report.NET
http://report.sourceforge.net/
Report.NET 是一个功能强大且易用的用来生成 PDF 文档的 C# 组件
---------------------------------------------------------------------------------------------------------
PHP库
1,Php Pdf Factory
http://sourceforge.net/projects/pdf-factory/
一个PHP的PDF操作库。
2,TCPDF
http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=tcpdf
TCPDF是一个用于快速生成PDF文件的PHP5函数包。TCPDF基于FPDF进行扩展和改进。支持UTF-8,Unicode,HTML和XHTML。
3,HTML2PDF
http://html2fpdf.sourceforge.net/
HTML2PDF能够把一个HTML文本转换成一个打印机友好的PDF文件。这个PHP脚本构建在FPDFPHP脚本之上。
4,cPdfWriter
http://www.palos.ro/index.php?page=opensource_active
cPdfWriter是一个能够输出PDF文档的PHP5 class。基于TCPDF,FPDF和其它相关脚本。
5,FPDF
http://www.fpdf.org/
FPDF这个PHP Class允许你采用纯PHP(更确切地说就是不需要使用PDFlib)来生成PDF文件。它所具有的特点包括:可选择的unit大小,页面格式和页边 距;页眉和页脚
管理;自动分页;自动换行与文本自动对齐;支持JPEG与PNG图片格式;支持着色和文件超链接;支持TrueType,Type1与 encoding;支持页面压缩。...
---------------------------------------------------------------------------------------------------------
PYTHON & RUBY库
1,Prawn
http://prawn.majesticseacreature.com/
Prawn: 用Ruby生成PDF更简捷
2,ReportLab
http://www.reportlab.org/
Reportlab是用python开发的生成pdf的工具包,它是一个开源软件。
3,PDF生成工具 pyPdf
PyPDF这是一个用于构建PDF的纯Python工具包
作者:EliteQing
出处:http://www.cnblogs.com/liinux/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。
欢迎加入网络爬虫QQ群:322937592 ;数据分析&网络爬虫
网络爬虫模拟登录开源项目ghost-login:ghost-login
微信订阅号:网络爬虫AI数据分析【WebCrawlerAIDA】