摘要: 更新 2014年2月27日:这篇文章最初只描述使用 PDFBox 来解析PDF文件。现在它已经被扩展到包括使用 IFilter 和 iTextSharp 的例程了。 这篇文章和对应的Visual Studio项目已经更新到目前最新的 PDFBox 版本(1.8.4)。可以从http://www.squarepdf.net/how-to-convert-pdf-to-text-in-net-sample-project/下载包含所有依赖内容的完整项目(要消除依赖关系有点棘手)。 如何解析 PDF 文件 在.NET中从PDF文件里提取文本的几种主要方法有:Microsoft 的 IFilt... 阅读全文
posted @ 2014-03-08 12:05 技术狂 阅读(1269) 评论(0) 推荐(0) 编辑