假设我在 Windows 平台上有一个扩展名为 .doc 的文件,我如何使用 C++ 中的 ofstream 对象打开该文件以将其内容输出到屏幕上?我知道该对象可用于以文本和二进制模式打开文件。但我想知道是否可以打开 .doc(甚至 .pdf)文件并读取其内容。
最佳答案
我以前从来没有真正做过这个,但是在阅读了它之后,我想我可能有一个建议。 .docx 格式实际上只是压缩后的 XML。解压后文件位于word/document.xml。在程序中执行此操作很有趣。
两个选项:如果您使用的是 C++ CLR (.NET),则 Microsoft has an SDK for you .它应该使打开 Office 文档变得非常容易。
否则,如果您只是使用常规 C++,则可能需要做一些额外的工作。
- 打开文件并使用类似zlib 的库将其解压缩
- 找到里面的document.xml文件
- 解析 XML 文档。您可能希望为此使用某种 XML 解析库。您必须查找 XML 的规范才能弄清楚如何获取所需的文本。
关于c++ - 在 C++ 中使用 ofstream 打开现有的 .doc 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13432633/