itext - 如何读取pdf表格内容数据?

标签 itext

我需要读取仅包含表格格式数据的 pdf 文件,就像 Excel 文件一样。我需要提取给定 pdf 文件的单元格值。 无论如何,使用 itext API 是否可行?如果您有什么要分享的,请分享它或任何其他解决方案?

最佳答案

PDF 格式只是一个 Canvas ,其中放置文本和图形,没有任何结构信息。因此,PDF 文件中不存在任何 iText-objects。每个页面中可能会有许多字符串,但您无法使用这些字符串重建短语或段落。可能绘制了许多线条,但您无法根据这些线条检索Table-object

简而言之:使用 iText 解析 PDF 文件的内容是不可能的。

You can try this!这使您可以阅读 PDF 页面。

关于itext - 如何读取pdf表格内容数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12069608/

相关文章:

c# - iTextSharp : How to add image of PDF as movable element?

java - 签署 PDF 文档并以字节或流的形式获取 pdf

java - 将控制台输出转换为 PDF 文件

java - 如何在不调整图像大小的情况下压缩PDF?

c# - 当我尝试压缩不同级别的 pdf 文件时,ITextSharp 返回相同大小的 pdf

c# - 使用 iTextSharp 创建 PDF 而不保存文件

java - 当不同表中的数据在 itext 中增加时,pdfptable 标题重复

iText横向和定位?

iText |无法设置单元格边框颜色