utf - 我的多语言 cms 应该使用 utf-8 或 utf-16 或 utf-32 吗?

标签 utf

除了字符存储方式不同之外,还有什么语言中 utf-32 可以显示而 utf-8 不能显示的特殊字符吗?

最佳答案

所有UTF编码都可以表示same range of code points (0 到 0x10FFFF)。因此,相同的字符可以由它们中的任何一个编码。

它们是否可以“显示”是一个完全不同的问题。这与编码无关,并且与所使用的字体系列的功能无关。我不确定是否有任何字体对于每个 Unicode 代码点都有字形。但我假设你的意思是“代表”。

它们在表示给定字符串所需的字节数方面确实有所不同。对于非亚洲语言来说,UTF-8 几乎总是最短的。对于这些,UTF-16 可能会获胜(我还没有真正进行“基准测试”。)我无法想象 UTF-32 是最佳的现实情况。

关于utf - 我的多语言 cms 应该使用 utf-8 或 utf-16 或 utf-32 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8164278/

相关文章:

c++ - 正确使用 boost 区域设置生成器

javascript - 在 Firefox 和 IE 中使用特殊字符,浏览器的编码方式不同

python - 影响编码、解码和打印的 python 设置列表是什么?

javascript - 如何使 JSON.stringify 编码 UTF 字符

unicode - 我需要补充飞机吗?

java - 如何在 Java 中生成没有键码的键盘事件?

Python文本文件中奇怪的换行符

java - 日语的 UTF-8

json - 在解码之前从 json 之类的字符串中去除无效 json 字符的最佳方法

javascript - Angular 将文本下载为文件,在记事本中不显示换行符