Java 7 应该解决一个老问题,即使用 UTF-8 以外的字符集解压 zip 存档。这可以通过构造函数 ZipInputStream(InputStream, Charset)
来实现。到目前为止,一切都很好。当显式设置 ISO-8859-1 字符集时,我可以解压缩包含文件名的 zip 存档,其中包含变音符号。
但是 问题是:当使用 ZipInputStream.getNextEntry()
遍历流时,条目的名称中包含错误的特殊字符。在我的例子中,变音符号“ü”被替换为“?”性格,这显然是错误的。有人知道如何解决这个问题吗?显然 ZipEntry
忽略了其底层 ZipInputStream
的 Charset
。它看起来像是另一个与 zip 相关的 JDK 错误,但我也可能做错了什么。
...
zipStream = new ZipInputStream(
new BufferedInputStream(new FileInputStream(archiveFile), BUFFER_SIZE),
Charset.forName("ISO-8859-1")
);
while ((zipEntry = zipStream.getNextEntry()) != null) {
// wrong name here, something like "M?nchen" instead of "München"
System.out.println(zipEntry.getName());
...
}
最佳答案
我玩了大约两个小时,但就在我最终将问题发布到这里五分钟后,我碰到了答案:我的 zip 文件不是用 ISO-8859-1 编码的,而是用 Cp437 编码的。所以构造函数调用应该是:
zipStream = new ZipInputStream(
new BufferedInputStream(new FileInputStream(archiveFile), BUFFER_SIZE),
Charset.forName("Cp437")
);
现在它就像一个魅力。
关于java - ZipInputStream(InputStream, Charset) 错误地解码 ZipEntry 文件名,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11276343/