xml - Ms Word 2003 和 2007 xml 差异

标签 xml ms-word wordml

有人可以解释 Ms Word 2003 和 2007 的 xml 结构的差异吗?干杯! :)

最佳答案

这是一个非常广泛的问题,因此很难知道您正在寻找什么样的解释,但要点可以说是:

a. Word 2003 XML 文件是真正的未压缩 XML 格式文件,可保存到单个未压缩文本文件中。 Word 2007 可以保存为该格式,但其 native 格式是存储在 .zip 文件中的 XML 和其他文件(例如图像文件)的 bundle 。主文档正文、页眉/页脚、脚注、样式、文档属性等都有单独的 XML 文件。不过,Word 2007 还可以保存为自己的单一未压缩 XML 文件格式(通常称为“Flat OPC”)。

b. Word 2003 格式中使用的主命名空间 URI 是 http://schemas.microsoft.com/office/word/2003/wordml

主文档的 Word 2007 格式中使用的主命名空间 URI 是 http://schemas.openxmlformats.org/wordprocessingml/2006/main

还使用了其他几个命名空间 URI,但对于 Word 2007,如果您希望为 ZIP 中包含的每种类型的 xml 文档使用不同的主命名空间,则可以使用不同的主命名空间。

c. AFAIK 在 Microsoft 之外,Word 2003 格式并未标准化。 Word 2007 格式是 ECMA-376 和 ISO 29500 这两个标准的基础。AFAICR 2007 符合或几乎符合 ECMA-376。只有 .zip 压缩格式是标准的。 Flat OPC 格式不是,据我所知,它使用的附加 XML 命名空间从未被正式记录(并不是说它难以理解)。

由于 OOXML 格式将 Word 文档拆分为多个单独的 XML 文档和其他组件(通常称为“部分”),因此该格式还使用“关系”文件,其中包含定义一个部分和一个部分之间的关​​系的 XML。其他。例如,如果主文档包含图片,则主文档的 XML 可能需要引用图像文件部分,但通常会通过使用关系 ID 而不是直接命名该部分来实现。

关于xml - Ms Word 2003 和 2007 xml 差异,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10804340/

相关文章:

vba - 在Word中使用VBA,如何找到特定的文本并在大纲中继续编号

java - 如何在 Java Web 应用程序中将 WordML 转换为 Office Open XML?

python - 如何使用 Python 设置 XML 元素的属性?

javascript - 在javascript中循环遍历json

excel - XSLT 超出表达式末尾的意外标记

python - 从word文档中提取标题文本

c# - Document.Body.Descendants<SdtBlock>() 不返回所有 *sdt* 元素

c# - 尝试将图像嵌入到 Word 文档中时出现关系错误

xml - 表组件显示 XML 数据源的空白报告

c# - 像使用 C# 的 python 的 lxml 一样读取 XML 文件?