java - 将具有特殊 unicode 的文本转换为普通文本 (java)

标签 java regex unicode

我有一个文本,其中包含许多 unicode (?) 字符,如下所示:

passaic$002c 新泽西 应该是:passaic, new jersey

Albert_W$002E_Barney 应该是:albert w.巴尼

Roosevelt_High_School_$0028Yonkers$002C_New_York$0029 应该是:Roosevelt_High_School_(Yonkers,_New_York)

我在网上搜索了一大堆这些字符:http://colemak.com/pub/mac/wordherd_source.txt

你知道有什么快速的方法可以把这些字符替换成原来的字符吗?请注意,我不想一个一个地替换这些字符中的每一个(比如使用 replaceAll。)相反,我想使用一个已经实现了这个的函数(可能是一个外部库)

最佳答案

关于java - 将具有特殊 unicode 的文本转换为普通文本 (java),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23130000/

相关文章:

java - 从带有月份名称的字符串日期获取周数

java - 按代表时间的 2 列对 JTable 进行排序

javascript - TotalVowels 变量未更新

javascript - 正则表达式匹配字母——包括非拉丁字母,但不包括表情符号

python - string.translate() 与 python 中的 unicode 数据

python - 脚本在通过 REST 接口(interface)传递 Unicode 时遇到问题

java - 如何在 java swing 应用程序中使用 Windows NT 登录凭据进行用户身份验证?

java - OneToMany 关系孤儿不会从数据库中删除

regex - 运行 groovy 时 Windows CMD 的奇怪行为

java - 如何在java中的字符之间使用.matches来匹配包含.*的字符串