python - 使用 Camelot 查找 PDF 尺寸

我正在使用 Camelot 读取完整的 PDF 并从每个 PDF 中提取大约 112 个属性。

我使用表格区域来提取属性

 test_variable = camelot.read_pdf(filename, flavor='stream', 
                 table_areas=['38, 340 ,50, 328'])

问题是对于所有文档中的相同属性，表区域并不是恒定的。有时我会在另一个文档中的 x 或 y 坐标下方几个像素处找到相同的属性。

 test_variable = camelot.read_pdf(filename, flavor='stream', 
                 table_areas=['38,350,50,338'])

有没有办法从同一区域获取准确的属性，而不管提取任何文档？

最佳答案

也许选项 table_regions(0.7 中引入)可以帮助您。

“当指定table_regions时，Camelot只会分析指定的区域来查找表。”

您可以定义一个更大的table_regions区域，Camelot将搜索该区域中的表。

关于python - 使用 Camelot 查找 PDF 尺寸，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54176697/