java - C 中 java.text.Normalizer.Form.NFD 和 utf8 proc 之间的编码问题

标签 java c character-encoding

我想知道在 Java 中处理德语、日语、韩语中的特殊字符(如 β)以及在 C 中处理 utf8 是否存在问题。

我们在 java 端使用 java.text.Normalizer.Form.NFD 并将字符串传递到 DB,其中我们在 C 中具有自定义函数来规范化字符串。我们遇到名称具有上升和特殊字符的问题..例如:如果name 为 äßÜ ,规范化 DB 后将其更改为用于规范化的 C 函数中的“assu”。

这是 C 中 UTF8 的问题还是 Java 和 C 规范化函数之间的不匹配。我们应该如何处理这些特殊字符..

最佳答案

尝试使用Normalizer.Form.NFC或Normalizer.Form.NFKC,可以找到更多信息here

关于java - C 中 java.text.Normalizer.Form.NFD 和 utf8 proc 之间的编码问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23196130/

相关文章:

java - 在 for 循环中,每次迭代都会计算数组的长度吗?

c - 将第一个字节设置为 0 或使用 memset 到 "reset"整个缓冲区

java - HTML 编号不适用于注册商标符号

java - 如何将对象与 Date 变量进行比较(Hibernate)? java.util.Date 与 java.sql.Timestamp

java - 通过二叉树进行追踪

c - _LARGEFILE_SOURCE 和 _FILE_OFFSET_BITS=64 有什么区别?

post - Spring 表单和 Controller UTF-8 错误编码

Node.js buf.toString 与 String.fromCharCode

java - 餐巾外观和感觉错误

C - 从二进制文件读取到任何结构