java - 如何将字符串中的特殊字符转换为unicode?

标签 java regex unicode special-characters

我找不到这个问题的答案,在这里尝试了几个答案结合起来找到有效的方法,但无济于事。 我正在处理的应用程序使用用户名来创建其中包含该名称的 PDF。然而,当某人的名字包含一个特殊字符,如 "Yağmur" 时,pdf 的创建者会吓坏并忽略这个特殊字符。 但是,当它获得 unicode 等效项 ("Yağmur") 时,它会在 pdf 中按原样打印 "Yağmur"

我如何检查任何特殊字符的名称/字符串 (regex = "[^a-z0-9 ]"),当找到时,用它的 unicode 等效字符替换该字符并返回新的统一编码字符串?

最佳答案

我将尝试以通用方式提供解决方案,因为您正在使用的框架没有作为问题陈述的一部分提及。

很久以前我也遇到过同样的问题。如果您将文本/字符编码设置为 UTF-8,这应该由 pdf 引擎处理。请找到如何在您的 pdf 生成框架中设置编码并尝试一下。希望对您有所帮助!!

关于java - 如何将字符串中的特殊字符转换为unicode?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32248553/

相关文章:

delphi - 无法使用delphi indy发送UTF-8电子邮件

Java 子字符串正在将我的正索引切换为负索引

java - 如何在 Java 应用程序更新期间实现向后兼容性?

java - Android中解析json对象和json数组

java - 客户端-maven-插件 - verifyAssetCatalog 失败

javascript - 这个正则表达式部分添加了什么?

java - 如何将正则表达式与字符和某些符号的任意组合匹配( '% and %' 之间的一行中的两个破折号除外)

arrays - 如何在另一个字符串的开头匹配数组中的字符串

unicode - 为什么从Unicode字符集中删除了U + D800到U + DFFF范围内的代码点?

Python字符串到unicode