xml - 是否所有 MS Word 文档都以 XML 可读格式序列化?

标签 xml ms-word

我试图了解 Word 文件在被 Microsoft Word 打开时是如何重建的,以及在保存编辑和关闭文件时它们以何种格式序列化。你有什么信息对我很有用吗?谢谢

最佳答案

所有 .doc 文件都存储在 binary format 中.打开和操作这些是痛苦的练习。

所有 .docx 文件实际上都是以 ZIP 格式存储的 XML 文件的集合。没错,只需将 .docx 或 .xmlx 或 .pptx 的扩展名更改为 .ZIP,您就可以像打开任何其他 ZIP 文件一样打开该文件。 MS 甚至为这些格式提供了一个 API,称为 Office Open XML .就个人而言,我认为 OOXML API 的学习曲线非常陡峭,当我倾向于制作 Word 文件或以其他方式操作它们时,我只是制作一个示例文件,解压缩它,然后操作它的内部结构。 IMO OOXML 文件的基础非常简单,无需大型旧 API 即可使用...

关于xml - 是否所有 MS Word 文档都以 XML 可读格式序列化?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2664210/

相关文章:

python - 使用 XPath 提取序列子集

java - Image View 和 onClickListener 问题

c# - 无需打开即可检查 Word 文档是否受密码保护

c# - 如何在 C# VSTO 3 的 word 文档中验证具有给定 ID 的表是否存在

vba - 用于更新 Word 文档中所有字段的宏

vba - MS Word : Creating shortcut or toolbar button for the "Paste Special..Unformatted Text" option

javascript - Haar.js 将 open cv xml 转换为 javascript

c# - WCF 如何将 List<T> 作为 XML 请求发送

java - XML 格式检查器返回文件过早结束。为什么?

c# - Word VSTO 加载项快捷键