java - 如何删除 Jsoup 中的 HTML 实体?

标签 java html jsoup

如何使用 Jsoup 删除 HTML 实体?如果我使用 Element.toString(),我会得到:

(...)
       <td>Letter &oacute;</td> //valid: <td>Letter ó</td>
(...)

最佳答案

这可能与您的问题的上下文无关,但如果您只想解码 HTML 实体而不对字符串进行任何其他更改(无标记处理、无评论剥离等),您可以使用 org.jsoup.parser.Parser.unescapeEntities ,例如:

assert Parser.unescapeEntities("x &asymp; <i>y</i>\n", true)
    .equals("x ≈ <i>y</i>\n");

关于java - 如何删除 Jsoup 中的 HTML 实体?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19963880/

相关文章:

javascript - 在IE11中测试时无法击中 Spring Controller

javascript - 使用 JavaScript 一次更改具有相同类名的多个元素的样式?

java - jsoup 发布和 cookie

jsoup - 将行追加到 HTML 文件

java - 如何将 MS Word HTML 文档转换为干净的 XHTML 内联样式?

java - 合并配置库

java - 不带坐标的 LinearGradientPaint

java - 从 JOptionPane 输入,在 JFrame 的 JTextArea 中输出?

html - 如何使绝对定位的元素仅使用必要的宽度?

javascript - 带增量的动态表单字段创建