java - 使用 Java 标准库将 HTML 字符转换回文本

标签 java html html-entities

我想使用 Java 标准库将一些 HTML 字符转换回文本。我想知道是否有任何图书馆可以实现我的目的?

/**
 * @param args the command line arguments
 */
public static void main(String[] args) {
    // TODO code application logic here

    // "Happy & Sad" in HTML form.
    String s = "Happy & Sad";
    System.out.println(s);

    try {
        // Change to "Happy & Sad". DOESN'T WORK!
        s = java.net.URLDecoder.decode(s, "UTF-8");
        System.out.println(s);
    } catch (UnsupportedEncodingException ex) {

    }
}

最佳答案

我认为您正在寻找 Apache Commons Lang 库的 StringEscapeUtils.unescapeHtml3()unescapeHtml4() 方法。见 https://commons.apache.org/proper/commons-text/javadocs/api-release/org/apache/commons/text/StringEscapeUtils.html .

关于java - 使用 Java 标准库将 HTML 字符转换回文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/599634/

相关文章:

java - java函数中是否可以返回多个值?

java - 将 EnumSet 转换为整数数组

JQuery ScrollTop 不适用于 Overflow

java - String.length() 的奇怪行为

java - 如何获取实例对象引用的类型?

html - 覆盖 WordPress Enfold 中自动生成的最大宽度 CSS 规则

HTML 和 CSS 嵌入式照片无法定位或 float

php - ENT_HTML5, ENT_HTML401, ... html_entity_decode 修饰符有什么作用?

perl - 使用 Mojo::DOM 处理 HTML 文档时,如何最可靠地保留 HTML 实体?

perl - 如何解码 utf 8 中的实体