ECMA-376(Office Open XML)标准文件阅读记录(一)
前言
工作离不开Excel,最近更是又要对大量Excel表格进行合并、汇总、计算、拆分等。把以前写的代码花了几天改了改,虽然是解决了这些工作内容,但总感觉这种解决方式不够优雅。想了想还是把ECMA-376标准文件拿出来读一遍,根据标准文件来写一个相对完善的底层库,让自己的代码能够勉强看得过去吧。
一、Office Open XML 简介
Office Open XML (Open XML) 是一种国际认可的文件格式标准,Office 软件套件实施这种标准来保存和交换信息。
Open XML 标准的主要目标之一是可与编写该标准时已存在的 Microsoft Office 文档集完全兼容。
Open XML 为 Office 软件实施者提供一个支持各种功能的标准。这些功能包括互操作性、存档保护、扩展性、与现有 Microsoft Office 文档的兼容性,等等。
Open XML 可提供广泛支持。例如:Mac 产品 iWork,Linux 操作系统上来自 OpenOffice.org 的产品,Windows 操作系统上,Microsoft Offic等均能够使用 Open XML 文件。
二、ECMA-376 标准
Open XML 格式由名为 ECMA(欧洲计算机厂家协会) 的标准组织定义。定义 Open XML 的特定文档是 ECMA-376 标准。
另一个全球标准组织是国际标准化组织 (ISO),它也提供一项 Open XML 标准,称为 ISO/IEC 29500。
ECMA-376 标准的第 2 版与 ISO 29500 的 Strict 版本相同。
ECMA-376 标准用于指定 Open XML,它描述了创建、编辑和保存 Open XML 文件所需的要求。它提供有关构成 Open XML 的标记语言的信息。它说明用于 Open XML 文件的打包约定,并介绍了软件供应商可用于构建该标准的自定义扩展的机制。ECMA-376 还介绍该标准的用于维护向后兼容性的功能。
三、Office 软件商 Open XML 实现的样子
我们使用WPS软件
新建一个XLSX格式
的Excel电子表格文件,例如:“人员信息表.xlsx”,然后将拓展名由.xlsx
修改为.zip
,解压后我们将看到以下文件结构:
_rels
---_rels.
docProps
---app.xml
---core.xml
---custom.xml
xl
---_rels
------workbook.xml.rels
---theme
------theme1.xml
---worksheets
------sheet1.xml
------sheet2.xml
------sheet3.xml
---sharedStrings.xml
---style.xml
---workbook.xml
我们打开xl
文件夹中的worksheets
文件夹,然后打开sheet1.xml
,将看到以下内容:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<worksheet xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main" xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships" xmlns:xdr="http://schemas.openxmlformats.org/drawingml/2006/spreadsheetDrawing" xmlns:x14="http://schemas.microsoft.com/office/spreadsheetml/2009/9/main" xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006" xmlns:etc="http://www.wps.cn/officeDocument/2017/etCustomData">
<sheetPr/>
<dimension ref="A1"/>
<sheetViews>
<sheetView tabSelected="1" workbookViewId="0">
<selection activeCell="A1" sqref="A1"/>
</sheetView>
</sheetViews>
<sheetFormatPr defaultColWidth="9" defaultRowHeight="13.5"/>
<sheetData>
<row r="1" spans="1:1">
<c r="A1" t="s">
<v>0</v>
</c>
</row>
</sheetData>
<pageMargins left="0.7" right="0.7" top="0.75" bottom="0.75" header="0.3" footer="0.3"/>
<pageSetup paperSize="9" orientation="portrait"/>
<headerFooter/>
</worksheet>
四、最后
现在虽然我们已经获得了Office文件的Open XML文件,但是其中如[Content_Types.xml]
等文件的含义,以及文件内容中如row
等标签,我们均不了解其代表的含义。接下来,我们就将开始阅读ECMA-376(Office Open XML)标准文件
,看看能不能通过标准文件将这些文件、标签等内容的含义弄明白。
博客园-本文作者(好先生FX http://www.cnblogs.com/hxsfx)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。