以下问题(还有更多地方讨论并解决了此问题)讨论了如何将包含 base64
图像的 .html
文件转换为一个 .docx
文件。
Posiible to use pandoc with HTML containing base64 inline images?
我想采用另一种方式 - 将包含图像的 .docx
转换为独立的 .html
文件,并使用可重现的 base64
代码(不一定具有相同的质量).docx
文件中存在的图像。首先,我尝试过:
pandoc -s -o chapter1.html cc.docx
以及
pandoc -o chapter1.html cc.docx
在这两种情况下,生成的 .html
文件都包含诸如 img src="media/image1.png"
之类的行,这表明 Pandoc 尝试过创建(或认为已创建)名为 media
的文件夹,其中放置 .docx
文件中的图形。但是Pandoc没有创建这样的文件夹。无论如何,我希望 .html
文件成为一个独立的文档(就像 .docx
文件),并且我不需要该文件夹。
我尝试在网上查找此问题,但我得到的唯一解决方案涉及将 .html
中的 base64
图像转换为 .docx 的问题
而不是相反。
最佳答案
也许两年前(2013 年 3 月)当您询问时它不起作用。现在有了最新版本的 Pandoc (v1.13.2.1):
pandoc -o out.html --self-contained in.docx
关于html - 如何使用 Pandoc 将带有数字的 DOCX 文件转换为使用 base64 的独立 HTML 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29022680/