有人可以解释 Ms Word 2003 和 2007 的 xml 结构的差异吗?干杯! :)
最佳答案
这是一个非常广泛的问题,因此很难知道您正在寻找什么样的解释,但要点可以说是:
a. Word 2003 XML 文件是真正的未压缩 XML 格式文件,可保存到单个未压缩文本文件中。 Word 2007 可以保存为该格式,但其 native 格式是存储在 .zip 文件中的 XML 和其他文件(例如图像文件)的 bundle 。主文档正文、页眉/页脚、脚注、样式、文档属性等都有单独的 XML 文件。不过,Word 2007 还可以保存为自己的单一未压缩 XML 文件格式(通常称为“Flat OPC”)。
b. Word 2003 格式中使用的主命名空间 URI 是 http://schemas.microsoft.com/office/word/2003/wordml
主文档的 Word 2007 格式中使用的主命名空间 URI 是 http://schemas.openxmlformats.org/wordprocessingml/2006/main
还使用了其他几个命名空间 URI,但对于 Word 2007,如果您希望为 ZIP 中包含的每种类型的 xml 文档使用不同的主命名空间,则可以使用不同的主命名空间。
c. AFAIK 在 Microsoft 之外,Word 2003 格式并未标准化。 Word 2007 格式是 ECMA-376 和 ISO 29500 这两个标准的基础。AFAICR 2007 符合或几乎符合 ECMA-376。只有 .zip 压缩格式是标准的。 Flat OPC 格式不是,据我所知,它使用的附加 XML 命名空间从未被正式记录(并不是说它难以理解)。
由于 OOXML 格式将 Word 文档拆分为多个单独的 XML 文档和其他组件(通常称为“部分”),因此该格式还使用“关系”文件,其中包含定义一个部分和一个部分之间的关系的 XML。其他。例如,如果主文档包含图片,则主文档的 XML 可能需要引用图像文件部分,但通常会通过使用关系 ID 而不是直接命名该部分来实现。
关于xml - Ms Word 2003 和 2007 xml 差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10804340/