java - 使用 Java 在 Windows 中读取 UTF-8 格式的 xml 文件会出现 "IOException: Invalid byte 2 of 2-byte UTF-8 sequence."错误

标签 java xml parsing utf-8

我的 Java 程序有问题。我如何读取具有“UTF-8”编码的 xml 文件。程序在 Kubuntu 中运行正常,但在 Windows 中无法运行。两个操作系统都正确写入 xml 文件,但在 Windows 中解析时出现异常错误。

String XMLFile = "ÄÄKKÖSET.xml"
Document doc = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(new File (XMLFile));

这是我需要解析的 xml 文件:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<deck created="04/04/2011">
  <title>ääkköset</title>
  <code>ÄÄKKÖSET</code>
  <description>ääkköset</description>
  <author>ääkköset</author>
  <cards nextCardID="1">
    <card color="#1364F9" id="0">
      <question>ÄÄKKÖSET</question>
      <answer>ÄÄKKÖSET</answer>
    </card>
  </cards>
</deck>

如何在 Windows 中使用 Java 读取 xml 文件而不出现“IOException:2 字节 UTF-8 序列的无效字节 2”。 -错误?

提前致谢!

最佳答案

Invalid byte 2 of 2-byte UTF-8 sequence.

您的 XML 文档尚未保存为 UTF-8,解析器会检测到这一点(因为并非所有字节序列都是合法的 UTF-8)并抛出错误。

解决办法是将文件保存为UTF-8。将文档声明为 UTF-8 是不够的 - 数据编码的字节必须与此声明匹配。默认情况下,Windows 上的许多文本编辑器都会默认将数据保存为 ANSI。

关于java - 使用 Java 在 Windows 中读取 UTF-8 格式的 xml 文件会出现 "IOException: Invalid byte 2 of 2-byte UTF-8 sequence."错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5538845/

相关文章:

javascript - 使用 Flex 解析器解析 Javascript 代码

java - 如何在 Spring boot Crud 存储库中编写条件自定义查询

java - 如何在java中将字符串数组作为列分配给二维字符串数组?

java - 解析 XML 并转换为集合

xml - XQuery 返回错误..?

Java 无法解析的日期

java - 为什么 ANTLR 没有正确打印 token 集?

java - JsonParseException,JSON 中不存在错误字符

java - 在 Java 数据库中执行基于 boolean 值的方法的好的设计是什么?

不合格属性名称的 XML 默认命名空间?