java - 损坏的文件处理

标签 java excel apache-poi

我想知道是否有人对使用 Apache POI

处理损坏文件有任何建议

我正在尝试打开一个文件并收到此消息:

Exception in thread "main" org.apache.poi.hssf.record.RecordInputStream$LeftoverDataException: Initialisation of record 0x1C left 2 bytes remaining still to be read.
    at org.apache.poi.hssf.record.RecordInputStream.hasNextRecord(RecordInputStream.java:156)
    at org.apache.poi.hssf.record.RecordFactoryInputStream.nextRecord(RecordFactoryInputStream.java:231)
    at org.apache.poi.hssf.record.RecordFactory.createRecords(RecordFactory.java:480)
    at org.apache.poi.hssf.usermodel.HSSFWorkbook.<init>(HSSFWorkbook.java:301)
    at org.apache.poi.ss.usermodel.WorkbookFactory.create(WorkbookFactory.java:95)
    at ExcelImporter.EditFileImportDialog.main(EditFileImportDialog.java:409)

这是一个SSCCE

import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.ss.usermodel.WorkbookFactory;

public class EditFileImportDialog {

    /* Omitted irrelevent code */

    public static void main(String[] args) {
        File file = new File("Z:\\Path\\To\\File_causing_the_trouble.xls");
        try {
            Workbook wb = WorkbookFactory.create(file);  // Line 409 for ref to the exception stack trace
            System.out.println(wb);
        } catch (InvalidFormatException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

仅此文件会发生这种情况,如果我在 excel 中打开文件并保存它,然后尝试使用 POI 打开它,则不会引发异常。关于如何处理这个问题的任何建议?

编辑:

请注意,我的问题可能与 this question 有关,但升级 POI 并没有解决我的问题,并且与所描述的文件存在差异。我已经四处寻找类似的答案,但也许如果有人知道 excel 文件本身有什么问题,我可以写一些东西来修补文件。

编辑 2

文件创建不在我的控制范围内。 Excel 仅在打开并重新保存文件时修复文件本身。不过我的问题是,是否有人可以想出一种方法来调整/增强 POI 以处理这个损坏的文件,就像 excel 能够解决问题一样。

编辑 3

回应几个评论/答案:

我的最终目标是完全不使用 excel。

  1. 文件已发送。
  2. 程序运行。
  3. 处理错误。
  4. 处理数据。

最佳答案

您可以尝试使用 HSSFWorkbook 打开 .xls 文件。

您可以使用以下代码检查 POI 如何响应确定 xls 格式。

private boolean isExcel(InputStream i) throws IOException {
return (POIFSFileSystem.hasPOIFSHeader(i) || POIXMLDocument.hasOOXMLHeader(i));
}

我会使用:

InputStream input = new FileInputStream(fileName);

代替:

File file = new File("Z:\\Path\\To\\File_causing_the_trouble.xls");

您检查文件中的单元格 0x1C 有什么问题吗?

关于java - 损坏的文件处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22786968/

相关文章:

java - 尝试运行 derby 时 Eclipse 上出现 "Could not find or load main class org.apache.derby.tools.ij"

vba - 使用另一个电子表格替换 Excel 数据

vba - 使用 VBA 批量将 TXT 转换为 XLS

java - 带有 Apache POI 的数据透视表和其他工作表的引用

java - 如何在 Java 中通过其 (unicode) 名称获取字符?我需要 Character.getName(int codePoint) 的反转

java - 如何从G1 gc日志中提取关键信息

vba - 如何找到数组的维数?

java - 使用 apache poi 将数据导出到 Excel 工作表列?

java - 使用 Apache poi 始终在 excel 单元格中显示两位小数

java - StringBuffer 未正确打印