apache-poi - 如何在 Java 中解析严格的 *.xlsx 文件

标签 apache-poi openxml import-from-excel

我需要从 xlsx 文件中解析数据。目前我正在使用 Jakarta-POI (v. 3.11) 来做到这一点。它可以很好地处理一些 xlsx 但不是全部。我注意到未正确解析的文件是使用 Office 2013 保存的“严格 xlsx”文件。更确切地说,此文件符合 ISO29500 而不是 ECMA-376,不同之处在于 ISO29500 文件中存在与类型的关系:

http://purl.oclc.org/ooxml/officeDocument/relationships/officeDocument

Jakarta-POI 正在寻找:

String CORE_DOCUMENT = "http://schemas.openxmlformats.org/officeDocument/2006/relationships/officeDocument"

有没有办法让 Jakarta-POI 读取这些文件?

最佳答案

OOXML Strict Converter for Office 2010如果您需要使用旧格式重新保存文档,可能会有所帮助。

一些 purl 命名空间列在 http://pyxb.sourceforge.net/PyXB-1.2.2/bundles.html 上(上面 Jethro 的链接似乎不再有效)。

可以在以下位置找到最新的 XML 模式文件: http://www.ecma-international.org/publications/standards/Ecma-376.htm

关于apache-poi - 如何在 Java 中解析严格的 *.xlsx 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29023542/

相关文章:

java - 在写入工作簿 WorkBook.write(out) Apache POI 时获取 java.lang.NullPointerException

java - 如何在每次运行时将从 Excel 文件读取的数据保存到新类中

java - 在 Apache POI XWPF 中用多个单词替换文本不起作用 - org.apache.xmlbeans.impl.values.XmlValueDisconnectedException

java - 使用xml解析查找word文档中的隐式分页符

php - 如何读取 PHPExcel 中的空单元格而不跳过值?

java - 如何在 Java 中使用 ODBC 将 Excel 文件导入 MySQL?

java - Apache POI HSMF 从 MSG 中提取 HTML 正文不起作用

c# - 工作表.CustomProperites OpenXML

c# - `WordprocessingDocument.Open` 后损坏的文件

c# - 导入和导出 Excel - 什么是最好的库?