unicode - 兼容范式中的字符串是否已经在相应的规范范式中？

标签 unicode normalization unicode-normalization

我的测试告诉我，从 Unicode 6.2 开始，完全兼容性分解中的所有字符都具有属性 NFD_Quick_Check=Yes。

这让我相信 isNFKD(x) 意味着 isNFD(x)，而 isNFKC(x) 意味着 isNFC(x)。

我的结论正确吗？那么稳定性呢？这些含义是否保证适用于 Unicode 标准的 future 版本？

最佳答案

你的结论是正确的。栏目 Design Goals Unicode 标准附件 #15 指出:

toNFKC(x) = toNFC(toNFKC(x))
toNFKD(x) = toNFD(toNFKD(x))

关于稳定性，如果规范化字符串不包含任何未分配的代码点，这将适用于 future 版本的 Unicode。

关于unicode - 兼容范式中的字符串是否已经在相应的规范范式中？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15694257/

上一篇：twitter-bootstrap - 让 Bootstrap 选项卡自动填充高度到页脚？

下一篇：angularjs - 自动保存模糊 + "Undo"按钮

相关文章：

unicode - Unicode第一，上一个，下一个和最后一个

java - 在 Java 中接收不同的内容

image-processing - 图像处理中面部标志点的归一化

objective-c - unicode表示形式叫什么？

c# - 在 C# 中如何获取以 Unicode 格式打印的 char 的最小值和最大值？

c++ - 由于下载由 libcurl 接收的 utf8 编码的 xml 数据而导致字符串损坏

mysql - MySQL 中的 Unicode(十六进制)字 rune 字

python - scikit-learn MinMaxScaler 产生的结果与 NumPy 实现略有不同

javascript - 如何搜索忽略重音字符的字符串(例如 ã = a)

c# - 如何在请求验证进入 MVC 4 之前清理输入？