我需要读取仅包含表格格式数据的 pdf 文件,就像 Excel 文件一样。我需要提取给定 pdf 文件的单元格值。 无论如何,使用 itext API 是否可行?如果您有什么要分享的,请分享它或任何其他解决方案?
最佳答案
PDF
格式只是一个 Canvas ,其中放置文本和图形,没有任何结构信息。因此,PDF 文件中不存在任何 iText-objects
。每个页面中可能会有许多字符串
,但您无法使用这些字符串重建短语或段落。可能绘制了许多线条,但您无法根据这些线条检索Table-object
。
简而言之:使用 iText
解析 PDF 文件的内容是不可能的。
You can try this!这使您可以阅读 PDF
页面。
关于itext - 如何读取pdf表格内容数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12069608/