java - docx4j 将 docx 转换为错误的 html 格式

标签 java html docx docx4j

我在使用 docx4j 示例时遇到一些问题。我需要将文件从 docx 转换为 html 格式并返回。我尝试编译 ConvertInXHTMLDocument.java 示例。它创建的 Html 文件很好,但是当尝试将其转换回 docx 时,会抛出缺少关闭标记(META、img 等)的异常。有人遇到过这个问题吗?

最佳答案

XHTMLImporter 要求其输入是格式良好的 XML。所以你需要确保你没有丢失关闭标签(META、img 等);如果这样做,请先运行 JTidy 或类似的程序。

docx4j 的 (X)HTML 输出可以是 HTML 或 XML。从 3.0 开始,属性 Convert.Out.HTML.OutputMethodXML 将控制哪个。

关于java - docx4j 将 docx 转换为错误的 html 格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16082612/

相关文章:

javascript - PHP/JavaScript 打印文档而不打开它

java - 有没有办法轻松修改 ANTLR4 的错误消息?

java - 是否有内置函数用于迭代处理 freemarker 字符串的结果?

java - 我可以将主体属性(而不是子属性)拉到我的 sitemesh/freemarker 装饰器中吗?

java - newInstance() 与新的

javascript - 从隐藏的所有内容开始

html - 悬停不适用于整个单元格

javascript - 在 4 个按钮之间移动并保持鼠标悬停

python - 在 python 3 中解析 .docx

java - 从 HTML 转换为 DocX 时如何处理特殊字符