我试图了解 Word 文件在被 Microsoft Word 打开时是如何重建的,以及在保存编辑和关闭文件时它们以何种格式序列化。你有什么信息对我很有用吗?谢谢
最佳答案
所有 .doc 文件都存储在 binary format 中.打开和操作这些是痛苦的练习。
所有 .docx 文件实际上都是以 ZIP 格式存储的 XML 文件的集合。没错,只需将 .docx 或 .xmlx 或 .pptx 的扩展名更改为 .ZIP,您就可以像打开任何其他 ZIP 文件一样打开该文件。 MS 甚至为这些格式提供了一个 API,称为 Office Open XML .就个人而言,我认为 OOXML API 的学习曲线非常陡峭,当我倾向于制作 Word 文件或以其他方式操作它们时,我只是制作一个示例文件,解压缩它,然后操作它的内部结构。 IMO OOXML 文件的基础非常简单,无需大型旧 API 即可使用...
关于xml - 是否所有 MS Word 文档都以 XML 可读格式序列化?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2664210/