ECMA-376(Office Open XML)标准文件阅读记录(一)

前言

工作离不开Excel,最近更是又要对大量Excel表格进行合并、汇总、计算、拆分等。把以前写的代码花了几天改了改,虽然是解决了这些工作内容,但总感觉这种解决方式不够优雅。想了想还是把ECMA-376标准文件拿出来读一遍,根据标准文件来写一个相对完善的底层库,让自己的代码能够勉强看得过去吧。

一、Office Open XML 简介

Office Open XML (Open XML) 是一种国际认可的文件格式标准,Office 软件套件实施这种标准来保存和交换信息。

Open XML 标准的主要目标之一是可与编写该标准时已存在的 Microsoft Office 文档集完全兼容。

Open XML 为 Office 软件实施者提供一个支持各种功能的标准。这些功能包括互操作性、存档保护、扩展性、与现有 Microsoft Office 文档的兼容性,等等。

Open XML 可提供广泛支持。例如:Mac 产品 iWork,Linux 操作系统上来自 OpenOffice.org 的产品,Windows 操作系统上,Microsoft Offic等均能够使用 Open XML 文件。

二、ECMA-376 标准

Open XML 格式由名为 ECMA(欧洲计算机厂家协会) 的标准组织定义。定义 Open XML 的特定文档是 ECMA-376 标准。

另一个全球标准组织是国际标准化组织 (ISO),它也提供一项 Open XML 标准,称为 ISO/IEC 29500。

ECMA-376 标准的第 2 版与 ISO 29500 的 Strict 版本相同。

ECMA-376 标准用于指定 Open XML,它描述了创建、编辑和保存 Open XML 文件所需的要求。它提供有关构成 Open XML 的标记语言的信息。它说明用于 Open XML 文件的打包约定,并介绍了软件供应商可用于构建该标准的自定义扩展的机制。ECMA-376 还介绍该标准的用于维护向后兼容性的功能。

三、Office 软件商 Open XML 实现的样子

我们使用WPS软件新建一个XLSX格式的Excel电子表格文件,例如:“人员信息表.xlsx”,然后将拓展名由.xlsx修改为.zip,解压后我们将看到以下文件结构:

_rels

---_rels.

docProps

---app.xml

---core.xml

---custom.xml

xl

---_rels

------workbook.xml.rels

---theme

------theme1.xml

---worksheets

------sheet1.xml

------sheet2.xml

------sheet3.xml

---sharedStrings.xml

---style.xml

---workbook.xml

我们打开xl文件夹中的worksheets文件夹,然后打开sheet1.xml,将看到以下内容:

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<worksheet xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main" xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships" xmlns:xdr="http://schemas.openxmlformats.org/drawingml/2006/spreadsheetDrawing" xmlns:x14="http://schemas.microsoft.com/office/spreadsheetml/2009/9/main" xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006" xmlns:etc="http://www.wps.cn/officeDocument/2017/etCustomData">
  <sheetPr/>
  <dimension ref="A1"/>
  <sheetViews>
    <sheetView tabSelected="1" workbookViewId="0">
      <selection activeCell="A1" sqref="A1"/>
    </sheetView>
  </sheetViews>
  <sheetFormatPr defaultColWidth="9" defaultRowHeight="13.5"/>
  <sheetData>
    <row r="1" spans="1:1">
      <c r="A1" t="s">
        <v>0</v>
      </c>
    </row>
  </sheetData>
  <pageMargins left="0.7" right="0.7" top="0.75" bottom="0.75" header="0.3" footer="0.3"/>
  <pageSetup paperSize="9" orientation="portrait"/>
  <headerFooter/>
</worksheet>

四、最后

现在虽然我们已经获得了Office文件的Open XML文件,但是其中如[Content_Types.xml]等文件的含义,以及文件内容中如row等标签,我们均不了解其代表的含义。接下来,我们就将开始阅读ECMA-376(Office Open XML)标准文件,看看能不能通过标准文件将这些文件、标签等内容的含义弄明白。

posted @ 2022-10-28 14:20  好先生FX  阅读(151)  评论(0编辑  收藏  举报