我想使用 Java 标准库将一些 HTML 字符转换回文本。我想知道是否有任何图书馆可以实现我的目的?
/**
* @param args the command line arguments
*/
public static void main(String[] args) {
// TODO code application logic here
// "Happy & Sad" in HTML form.
String s = "Happy & Sad";
System.out.println(s);
try {
// Change to "Happy & Sad". DOESN'T WORK!
s = java.net.URLDecoder.decode(s, "UTF-8");
System.out.println(s);
} catch (UnsupportedEncodingException ex) {
}
}
最佳答案
我认为您正在寻找 Apache Commons Lang 库的 StringEscapeUtils.unescapeHtml3()
和 unescapeHtml4()
方法。见 https://commons.apache.org/proper/commons-text/javadocs/api-release/org/apache/commons/text/StringEscapeUtils.html .
关于java - 使用 Java 标准库将 HTML 字符转换回文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/599634/