java - 带有特殊字符的xml,编码utf-8

标签 java xml encoding utf-8

我有几个简单的问题,因为我在阅读所有差异回复时感到困惑。

1) 如果我有一个带有序言的 xml:<?xml version="1.0" encoding="utf-8" ?>我将使用 Java 对其进行解码(例如:JaXB)。我想,我不能将 CROSS OF LORRAINE ( http://www.fileformat.info/info/unicode/char/2628/index.htm ) 放入其中,但我可以放入“\u2628”,对吗?

2) 我也听说 UTF-8 不包含它,但是 Unicode 中的任何内容都可以使用编码 UTF-8(或 UTF-16)保存,这是本页的一个示例:

UTF-8(十六进制)0xE2 0x98 0xA8 (e298a8)

我的推理正确吗?我可以使用这种形式并将其以utf-8编码放入xml中吗?

最佳答案

如果您的 prolog 指定 xml 的 utf-8 编码:

<?xml version="1.0" encoding="utf-8" ?>

那么可以直接使用utf-8字符,也可以编码为☨

关于java - 带有特殊字符的xml,编码utf-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2859616/

相关文章:

java - 如何在Struts迭代器标签中添加条件?

java - 创建一个数组,其中包含一定范围内的随机值

python - 在 lxml 中查找具有未知 namespace 的元素

php - 用JS和PHP转义 "+"

java StringTokenizer - nextToken 可以返回 null 吗?

c# - 如何检查xElement值是否存在?

java - Android Studio 3.6 Canary 12 XML 布局无法解析

http - 为 HTTP 服务器响应禁用分块编码

java - 加密 Deflate 并编码为 Base64 Xml

java - 为weka提供训练集和无标签集