python - pdfquery 加载问题

我在 python 中使用 pdfquery 库来提取文本。为此，我加载了 pdf，到目前为止它始终有效。但是当我尝试使用 pdf 时我遇到了以下问题:

当我运行代码时:

import pdfquery
pdfQuery = pdfquery.PDFQuery('10241.pdf')
pdfQuery.load()

程序似乎卡住了，永远无法完成。

有人遇到过这个问题吗？或者有什么解决办法吗？

谢谢。

最佳答案

您的 PDF 有多少页？

指定要加载的页面数可能会有所帮助:

pdfQuery.load(0)

上面的代码将只加载第一页并节省时间。

关于python - pdfquery 加载问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36527938/

相关文章：

python - 从 PDF 中提取页眉/页脚(以编程方式)