我正在考虑在我的 Django 项目中使用富文本编辑器
。 TinyMCE 看起来是显而易见的解决方案,但是我看到输出格式是 html ( here )。目标是存储用户输入,然后使用 python-docx(不是 html)在 Word 文档中提供它。
你知道有什么解决办法吗?要么是tinyMCE的功能,要么是保持样式的html到word格式转换器,或者可能是类似于tinymce的另一个富文本编辑器?
UPDATE:
This是我发现效果很好的另一种选择。仍在尝试将 HTML 转换为 Word 而不丢失样式。解决方案可能是 pywin32
,如所述 here但它对我没有多大帮助+它仅限于 Windows。
Update2
经过一番挖掘,我发现 pandoc和 pypandoc它似乎能够翻译成以下任何输出格式:
“asciidoc,beamer,commonmark,上下文,docbook,docbook4,docbook5,docx,dokuwiki,dzslides,epub,epub2,epub3,fb2,gfm,haddock,html,html4,html5,icml,jats,json, latex , man、markdown、markdown_github、markdown_mmd、markdown_phpextra、markdown_strict、mediawiki、ms、muse、 native 、odt、opendocument、opml、org、普通、pptx、revejs、rst、rtf、s5、slideous、slidy、tei、texinfo、纺织品、 zimwiki”
我还没弄清楚如何将这样的输入集成到 python-docx 中。
最佳答案
我也面临着同样的挑战。您将需要使用 Python 的 Beautiful Soup 库来迭代 HTML 编辑器中的内容(我使用 Summernote,但任何 HTML 编辑器都应该可以),然后将 HTML 标签解析为 python-docx 的可用格式。 Pandoc 和 Pypandoc 将为您转换文件(例如,您从 LateX 文件开始,需要将其转换为 Word),但不会提供需要与 xml/html 相互转换的工具。
祝你好运!
关于django - TinyMCE、Django 和 python-docx,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50524692/