我的字符串包含奇怪的 UTF 字符...我该如何处理?
例如 è =\è ...
所以我有
String str = "Pel\&\#232" ;
String correct str2 =??? ; // i'd like to have "Pelè"
然后我有很多奇怪的字符,我真的不知道如何处理......
另一个例子:“J. Ho\řej\š”
有人可以帮忙吗?
<小时/>非常感谢您的回答。
我正在阅读一个大文本文件,该文件是从我无法更改的网站下载的。
在文件本身中,人名就这样保存。不是文件的编码。
我也无法手动执行此操作,因为我有 300 个名称存在此问题。
另一个例子:
在文本文件中,人名是“Constantin S\ârbu”,应该是 Sîrbu
我被困住了
编辑*** 我解决了创建一个手动函数来将 HTML 值与 unicode 相关联...花了我一段时间,但它有效。
最佳答案
我认为你可以将 è 放在字符串本身中。就像是:
String s = "Pelè";
关于java - 使用 UTF 字符编码 java 字符串\&\#232,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6698238/