pandoc - 将docx转换为markdown时如何避免markdown上的图像大小标签?

标签 pandoc

我正在使用 pandoc 1.16.0.2 转换 docx 文件,除了在每个图像之后,一切都很好,大小属性在 teh 中显示为文本

![](./media/media/image4.png){width="3.266949912510936in"
height="2.141852580927384in"}

因此,它在 md 中显示了图像,但也将大小标签显示为每个图像后面/之后/下方的纯文本。我使用的命令是:
pandoc --extract-media ./media2 -s word.docx markdown -o exm_word2.md

我已经尽我所能阅读了手册,但没有看到任何用于控制它的标志。此外,大多数搜索都出现在人们想要拥有属性并控制它们的地方。

有什么建议可以取消大小属性,还是我的 Markdown 应用程序(MarkdownPad2 - v-2.5.x)读错了这个 md?

最佳答案

您可以编写一个过滤器来执行此操作。您需要安装 panflute .将此另存为 remove_img_size.py :

import panflute as pf


def change_md_link(elem, doc):
    if isinstance(elem, pf.Image):
        elem.attributes.pop('width', None)
        elem.attributes.pop('height', None)
    return elem


if __name__ == "__main__":
    pf.run_filter(change_md_link)

然后编译
pandoc word.docx -F remove_img_size.py -o exm_word2.md

关于pandoc - 将docx转换为markdown时如何避免markdown上的图像大小标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41903398/

相关文章:

r - Rmarkdown 文档的字体

r - 在 rmarkdown::html_document() .Rmd 中使用 highlight.js 主题

r - 如何在Rmarkdown/Pandoc中禁止自动图形编号

r - 在 Markdown 中更改图形的标题

r-markdown:pdf_documents 的德语引号

r-markdown - 从两个不同位置编织时在 Rmarkdown 中使用相对路径

用于编织 HTML 与 PDF 的 R Markdown 条件

R bookdown、PDF、未编号的前言和标题在以下目录中无法按预期工作

lua - Pandoc Lua 过滤器 : how to specify attributes for Span element

github - 有没有办法为 GitHub 创建一个从其他 `README.md` 文件编译而来的 `.md` 文件?