我有一个 ASCII 字符串,带有 HTML 实体,例如:
à
¨
ç
我需要这个字符串没有那些实体并将它们转换成 UTF-8 字符。 在 Java 中有什么简单的方法可以做到这一点吗?
地点:
Clazz.method("aà","UTF-8")
返回“aà”
或者类似的东西?
最佳答案
看看org.apache.commons.lang.StringEscapeUtils.unescapeHtml(...) .显然它理解 HTML 4 中定义的所有字符实体。
关于java - 如何在 Java 中将 HTML 转换为 UTF-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2825985/