java - 如何在 Java 中将 HTML 转换为 UTF-8

标签 java html utf-8

我有一个 ASCII 字符串,带有 HTML 实体,例如:

 à
 ¨
 ç

我需要这个字符串没有那些实体并将它们转换成 UTF-8 字符。 在 Java 中有什么简单的方法可以做到这一点吗?

地点:

 Clazz.method("aà","UTF-8")

返回“aà”

或者类似的东西?

最佳答案

看看org.apache.commons.lang.StringEscapeUtils.unescapeHtml(...) .显然它理解 HTML 4 中定义的所有字符实体。

关于java - 如何在 Java 中将 HTML 转换为 UTF-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2825985/

相关文章:

java - Selenium Chrome驱动程序不遵守隐式等待吗?

java - 为什么 List<Number> 不是 List<Object> 的子类型?

python - 根据字节数正确拆分 unicode 字符串

c++ - 俄语(或非拉丁语)文件名加载 Qt Windows

asp.net - 如何为文本格式设置 div 元素的边框?

php - 增加 charset ="utf-8"php/mysql 站点中的字体大小

java - 检测分配

java - 计算整数的位数

javascript - 单个 HTML 表单中的多个提交按钮

html - 我的图像没有改变大小