C#仪器数据文件解析-PDF文件
不少仪器工作站输出的数据报告文件为PDF格式,PDF格式用于排版打印,但不易于数据解析,因此解析PDF数据需要首先读取到PDF文件中的文本内容,然后根据内容规则解析有意义的数据信息。
C#解析PDF文件常用的库有PDFBox和iTextSharp,PDFBox为Java库,通过IKVM使用,因此调用方法、属性等比较变扭。
PDFBox解析PDF文本示例:
PDDocument doc = PDDocument.load(input); str = new PDFTextStripper().getText(doc); doc.close();
iTextSharp解析PDF文本示例:
PdfReader reader= new PdfReader(fileName); for (int pageNumber = 1; pageNumber <= reader.NumberOfPages; ++pageNumber) stringBuilder.AppendLine(PdfTextExtractor.GetTextFromPage(reader, pageNumber)); reader.Close();
作者:马洪彪
出处:http://www.cnblogs.com/mahongbiao/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。