java - 我应该使用 Unicode 符号的哪个子集来标记文本中的特殊子字符串？

我们的应用程序发送字符串，然后将其本地化到客户端。有时那些是整个字符串，有时只是子字符串，所以我们必须标记它们。如果它只使用 Unicode，那将是最好的，因为它不需要任何协议(protocol)更改。

示例:

"Length: (mark)10(mark)"

其中 10 是以厘米为单位的长度，但应进行转换以显示为英寸或毫米。
Unicode 特殊字符 (0xFFF0-0xFFFF) 是在文本中标记此类特殊子字符串的正确选择吗？

最佳答案

不，代码点在 Specials block 中各有用途。将它们用于其他目的可能会导致意想不到的效果。即使您自己对所有处理进行编码，传入的数据也可能包含这些代码点。当然可以检测并过滤掉它们，但最好使用不会与任何分配的代码点冲突的代码点。

使用 U+FDD0..U+FDEF 范围内的代码点。它们被指定为“非字符”，旨在用于应用程序内部。请参阅 Unicode 常见问题解答部分 Private-Use Characters, Noncharacters & Sentinels FAQ .

关于java - 我应该使用 Unicode 符号的哪个子集来标记文本中的特殊子字符串？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25343299/