unicode - 兼容范式中的字符串是否已经在相应的规范范式中?

标签 unicode normalization unicode-normalization

我的测试告诉我,从 Unicode 6.2 开始,完全兼容性分解中的所有字符都具有属性 NFD_Quick_Check=Yes。

这让我相信 isNFKD(x) 意味着 isNFD(x),而 isNFKC(x) 意味着 isNFC(x)。

我的结论正确吗?那么稳定性呢?这些含义是否保证适用于 Unicode 标准的 future 版本?

最佳答案

你的结论是正确的。栏目 Design Goals Unicode 标准附件 #15 指出:

toNFKC(x) = toNFC(toNFKC(x))
toNFKD(x) = toNFD(toNFKD(x))

关于稳定性,如果规范化字符串不包含任何未分配的代码点,这将适用于 future 版本的 Unicode。

关于unicode - 兼容范式中的字符串是否已经在相应的规范范式中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15694257/

相关文章:

unicode - Unicode第一,上一个,下一个和最后一个

java - 在 Java 中接收不同的内容

image-processing - 图像处理中面部标志点的归一化

objective-c - unicode表示形式叫什么?

c# - 在 C# 中如何获取以 Unicode 格式打印的 char 的最小值和最大值?

c++ - 由于下载由 libcurl 接收的 utf8 编码的 xml 数据而导致字符串损坏

mysql - MySQL 中的 Unicode(十六进制)字 rune 字

python - scikit-learn MinMaxScaler 产生的结果与 NumPy 实现略有不同

javascript - 如何搜索忽略重音字符的字符串(例如 ã = a)

c# - 如何在请求验证进入 MVC 4 之前清理输入?