java - 如何将 MS Word HTML 文档转换为干净的 XHTML 内联样式?

标签 java css ms-word html-parsing jsoup

我的内部 CSS 有问题。 Jsoup 不解析 @font-face 或类似的。如何清理 MS Word HTML 文档?

最佳答案

这是我的经验。

我们也需要解析word文档,但是复杂的word内容让我们望而却步。我们有一个富文本编辑器,它允许将 word 中的内容传递到其中,然后我们将该内容提交到服务器以通过 jsoup 对其进行解析。

它可能无法解决您的问题,但只是我的 2 美分..

关于java - 如何将 MS Word HTML 文档转换为干净的 XHTML 内联样式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8072137/

相关文章:

java - 为什么我的Java程序中的好友列表不显示?

java - 来自 GWT 的 Spring

html - 尝试从导航菜单中删除填充,以便在悬停时颜色不会改变

java - 是否有准备好使用 Java lifo 类(堆栈)并在重新插入时推到前面?

jquery - 在小型设备上将 12 列 div 向下推到新行

css - 使 ReactStrap/Bootstrap4 卡片在不同的列中具有相同的高度

java - 将 Java 框架保存为 Microsoft Word 或 PDF 文档?

ms-word - Word 2007 功能区 - 正确对齐组中的控件

ms-word - 如何禁用Word中的拼写检查弹出窗口?

java - 使用硬编码坐标缩放游戏以适应任何屏幕?