java - 使用 POI Java 提取 Word 文档表格单元格中的内容

标签 java text apache-poi extract

我一直在使用 Java 和 POI 从 Word 文档 (docx) 中提取数据。基本上我想提取两列表中包含的数据。我希望程序能够区分左列和右列并将各种值存储在数组中,事实是它逐行提取文本:

table.getText()

我使用了这种方法,但它不能区分单元格。它只是抓取一行中的所有文本。

我使用的代码可以找到here

我找不到提取每个单元格中文本的方法

最佳答案

基于 https://poi.apache.org/apidocs/index.html 处的 javadocs ,我会尝试这样的事情:

table.getRow(0).getCell(0).getText();

您可能希望将其放入循环中以单独检索每行中的文本。但这些东西都不是可迭代的,因此您必须使用 for 循环来检索数据。 getRow() 中的整数和getCell()是表格行和单元格的从零开始的索引。

当你查看javadocs时,类都在 org.apache.poi.xwpf.usermodel 中。如果您想深入挖掘,则需要获取源代码。

关于java - 使用 POI Java 提取 Word 文档表格单元格中的内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37449235/

相关文章:

java.lang.AbstractMethodError : javax. xml.parsers.DocumentBuilderFactory.setFeature(Ljava/lang/String;Z)V

javascript - Rhino:如何让Rhino计算Java字符串上的RegEx表达式?

Java名字冲突,如何用模板类改写程序

file - 如何计算两个license.txt文件之间的相似度?

c - 在 C 中读取具有不同扩展名的 .txt 文件

java - 带有 Apache POI 的数据透视表和其他工作表的引用

java - 如何将 HttpClientBuilder 与 Http 代理一起使用?

java - 如何仅在 HTTP 请求连接器中提供地址?

ios - UILabel 下划线文本,高字符低于基线

java - APACHE POI,如何查找单元格的行索引?