java - Jsoup:如何将包含 HTML 的字符串转换为 XHTML 文档?

标签 java html parsing xhtml jsoup

标题说明了一切。如何使用 Jsoup 做到这一点?我不需要文件。只需使用 XHTML。我只找到了一些带有字节数组和文件输出的示例。我只需要一个有效的 XHTML 即可稍后与 itext PdfWriter 和 XMLWorker 一起使用。

最佳答案

我相信这样的事情会成功

Document doc = Jsoup.parse(html);
doc.outputSettings().escapeMode(Entities.EscapeMode.xhtml); //This will ensure the validity
doc.outputSettings().charset("UTF-8");
System.out.println(doc);

关于java - Jsoup:如何将包含 HTML 的字符串转换为 XHTML 文档?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28876603/

相关文章:

java - 解析包含用户输入的自由文本的字符串

regex - 使用正则表达式解析文本文件

JavaCV 示例/教程

java - 分形渲染器中的 HashSet 性能问题

Java:定义为全局变量时处理 IOException

java - Android:使屏幕 "flash"变白

python - Pandas read_html 返回原始 HTML 内容[对于某些行/单元格/等]

html - float 不正确清除导致元素隐藏在它们后面

Javascript - 更改事件链接并在链接末尾添加句点

php - PHP解析/语法错误;以及如何解决它们