随笔分类 - Office
Word、Excel、Pdf
摘要:一、帆软报表简介 报表工具中,帆软报表相比Crystal Report(水晶报表)、SQL Server Report Service(SSRS)等报表工具来说算是佼佼者,此外帆软报表在统计图表、数据填报方面应用也不错,此处仅针对帆软的基本报表功能的应用说事儿。 http://www.fanruan
阅读全文
摘要:不少仪器数据报告输出为Word格式文件,同Excel文件,Word文件doc和docx的存储格式是不同的,相应的解析Word文件的方式也类似,主要有以下方式: 1.通过MS Word应用程序的DCOM接口; 2.WPS Word应用程序的DCOM接口,其他Office应用程序,例如Open Offi
阅读全文
摘要:不少仪器工作站可以将数据导出为Excel文件,包括97-2003版本的xls文件和2007+的xlsx文件。 采集Excel文件相比采集pdf文件更容易、程序更健壮,毕竟Excel中数据有明确的行、列的定义,利于数据解析。 Excel早期的xls文件和后来的xlsx文件的格式不一样,xls是二进制特
阅读全文
摘要:不少仪器工作站输出的数据报告文件为PDF格式,PDF格式用于排版打印,但不易于数据解析,因此解析PDF数据需要首先读取到PDF文件中的文本内容,然后根据内容规则解析有意义的数据信息。 C#解析PDF文件常用的库有PDFBox和iTextSharp,PDFBox为Java库,通过IKVM使用,因此调用
阅读全文
摘要:RTF格式文件大家并不陌生,但RTF文件的编码、解码却很难,因为RTF文件是富文本格式的,即文件中除了包含文本内容,还包含文本的格式信息,而这些信息并没有像后来的docx等采用XML来隔离格式和内容,因此解码很难。 一些仪器的数据报告以RTF格式输出,因为RTF可以使用写字板进行编辑,写字板程序在W
阅读全文
摘要:XPS为微软推出的类似于Adobe PDF的一种文件格式,个人认为XPS很好,但毕竟PDF已经被大家所熟知,因此XPS的使用很少,也少有仪器数据输出为该格式。 XPS百度百科:https://baike.baidu.com/item/XPS%E6%A0%BC%E5%BC%8F%E6%96%87%E4
阅读全文
摘要:使用NOPI读取Excel的例子很多,读取Word的例子不多。Excel的解析方式有多中,可以使用ODBC查询,把Excel作为一个数据集对待。也可以使用文档结构模型的方式进行解析,即解析Workbook(工作簿)、Sheet、Row、Column。Word的解析比较复杂,因为Word的文档结构模型...
阅读全文
摘要:C#解析PDF的方式有很多,比较好用的有ITestSharp和PdfBox。 PDF内容页如果是图片类型,例如扫描件,则需要进行OCR(光学字符识别)。 文本内容的PDF文档,解析的过程中,我目前仅发现能以字符串的形式读取的,不能够读取其中的表格。据说PDF文档结构中是没有表格概念的,因此这个自然是
阅读全文