如何使用 Jsoup 删除 HTML 实体?如果我使用 Element.toString(),我会得到:
(...)
<td>Letter ó</td> //valid: <td>Letter ó</td>
(...)
最佳答案
这可能与您的问题的上下文无关,但如果您只想解码 HTML 实体而不对字符串进行任何其他更改(无标记处理、无评论剥离等),您可以使用 org.jsoup.parser.Parser.unescapeEntities
,例如:
assert Parser.unescapeEntities("x ≈ <i>y</i>\n", true)
.equals("x ≈ <i>y</i>\n");
关于java - 如何删除 Jsoup 中的 HTML 实体?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19963880/