我有几个简单的问题,因为我在阅读所有差异回复时感到困惑。
1) 如果我有一个带有序言的 xml:<?xml version="1.0" encoding="utf-8" ?>
我将使用 Java 对其进行解码(例如:JaXB)。我想,我不能将 CROSS OF LORRAINE ( http://www.fileformat.info/info/unicode/char/2628/index.htm ) 放入其中,但我可以放入“\u2628”,对吗?
2) 我也听说 UTF-8 不包含它,但是 Unicode 中的任何内容都可以使用编码 UTF-8(或 UTF-16)保存,这是本页的一个示例:
UTF-8(十六进制)0xE2 0x98 0xA8 (e298a8)
我的推理正确吗?我可以使用这种形式并将其以utf-8编码放入xml中吗?
最佳答案
如果您的 prolog 指定 xml 的 utf-8 编码:
<?xml version="1.0" encoding="utf-8" ?>
那么可以直接使用utf-8字符,也可以编码为☨
关于java - 带有特殊字符的xml,编码utf-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2859616/