Android从文本文件中获取UTFDataFormatException读取UTF

标签 android utf datainputstream

我注意到我的 Android 应用程序事件日志中出现 UTFDataFormatException 错误。我正在阅读的文件是由我的应用程序编写的,尽管它存储了有关用户故事的信息,但它可能包含任何类型的字符/字符串。我想知道读取/写入某些字符是否有问题?

我用:

dos.writeUTF(myJSONString);

我阅读了使用:

textJSONString = dis.readUTF();

我记录的一些错误堆栈跟踪是:

class: class java.io.UTFDataFormatException

message: bad second or third byte at 1795

    java.io.charset.ModifiedUtf8.decode(ModifiedUtf8.java:53) 
java.io.DataInputStream.decodeUTF(DataInputStream.java:444) 
java.io.DataInputStream.decodeUTF(DataInputStream.java:438) 
java.io.DataInputStream.readUTF(DataInputStream.java:433)...

我已经查找了解码方法的来源,但我不明白发生了什么/为什么它失败了:

public static String decode(byte[] in, char[] out, int offset, int utfSize) throws UTFDataFormatException {
        int count = 0, s = 0, a;
        while (count < utfSize) {
            if ((out[s] = (char) in[offset + count++]) < '\u0080') {
                s++;
            } else if (((a = out[s]) & 0xe0) == 0xc0) {
                if (count >= utfSize) {
                    throw new UTFDataFormatException("bad second byte at " + count);
                }
                int b = in[offset + count++];
                if ((b & 0xC0) != 0x80) {
                    throw new UTFDataFormatException("bad second byte at " + (count - 1));
                }
                out[s++] = (char) (((a & 0x1F) << 6) | (b & 0x3F));
            } else if ((a & 0xf0) == 0xe0) {
                if (count + 1 >= utfSize) {
                    throw new UTFDataFormatException("bad third byte at " + (count + 1));
                }
                int b = in[offset + count++];
                int c = in[offset + count++];
                if (((b & 0xC0) != 0x80) || ((c & 0xC0) != 0x80)) {
                    throw new UTFDataFormatException("bad second or third byte at " + (count - 2));
                }
                out[s++] = (char) (((a & 0x0F) << 12) | ((b & 0x3F) << 6) | (c & 0x3F));
            } else {
                throw new UTFDataFormatException("bad byte at " + (count - 1));
            }
        }
        return new String(out, 0, s);
    }

有什么想法吗?

最佳答案

此错误表明文件已损坏(即:未正确编码 UTF8)。写入文件后是否正确关闭文件?我可以想象,如果您正在写入缓冲输出流并且没有正确关闭该流,您将遇到这些错误。然后一些字节将不会被写入,并且您将拥有一个无法重新读取的损坏文件。

关于Android从文本文件中获取UTFDataFormatException读取UTF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11210504/

相关文章:

android - eclipse 中的“Intent 无法解析为类型”错误

java - Android - 如果未安装,如何获取应用程序图标?

java - 为什么 DataInputStream.readUTF() 导致主线程永远等待? [套接字编程]

Java DataOutputStream/DataInputStream OutOfMemoryError

android - 如果强制关闭目标应用程序,PendingIntent 会发生什么情况?

java - Android ImageView 顶部裁剪

c++ - 在 C++ 中打印汉字

macos - OSX Emacs : unbind just the right alt?

Python3编码问题

java - 从网页响应读取字节时出现问题 (amf)