我的原始来源是 HTML,不是格式良好的 XHTML。更糟糕的是,我将不得不清理并将 html 转换为 xhtml,然后喂 Flying Saucer 。
最佳答案
Flying Saucer 不支持HTML;如其 website 中所述:“不支持旧版 HTML(尽管有多种不同质量的开源 Java HTML 清理器可用)。”不过,您可以尝试他们推荐的 HTML 清理器之一。毫不奇怪,最好的之一是 HtmlCleaner .
关于java - Flying Saucer 接受 HTML 而非 XHTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5629220/