java - 使用 UTF 字符编码 java 字符串\&\#232

标签 java encoding utf-8

我的字符串包含奇怪的 UTF 字符...我该如何处理?

例如 è =\è ...

所以我有

String str = "Pel\&\#232" ;
String correct str2 =??? ; // i'd like to have "Pelè"

然后我有很多奇怪的字符,我真的不知道如何处理......

另一个例子:“J. Ho\řej\š”

有人可以帮忙吗?

<小时/>

非常感谢您的回答。
我正在阅读一个大文本文件,该文件是从我无法更改的网站下载的。 在文件本身中,人名就这样保存。不是文件的编码。 我也无法手动执行此操作,因为我有 300 个名称存在此问题。

另一个例子:

在文本文件中,人名是“Constantin S\ârbu”,应该是 Sîrbu

我被困住了

编辑*** 我解决了创建一个手动函数来将 HTML 值与 unicode 相关联...花了我一段时间,但它有效。

最佳答案

我认为你可以将 è 放在字符串本身中。就像是: String s = "Pelè";

关于java - 使用 UTF 字符编码 java 字符串\&\#232,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6698238/

相关文章:

mysql - 将非 utf8 数据库转换为 utf-8

python - 使 Emacs 在 Python 交互模式下使用 UTF-8

C#部分UTF-8字节流转换

javascript - Spring Boot 通过嵌入式 Tomcat 在 web-application.jar 之外提供外部 HTML/javascript/css 服务?

java - 我的成绩簿程序无法正确打印到 Excel 文档

java - `obj` 中的 `synchronized(obj) {...}` 参数的目的是什么?

Java——最高效的匹配方法

pandas - 删除编码 "UTF8": 0x00 chars from pandas dataframe for psycopg2 cursor

assembly - RISC-V 立即编码符号到底是如何工作的?

vim - 如何正确设置 vim 以进行 utf-8 编辑