我在 python 中使用 pdfquery 库来提取文本。为此,我加载了 pdf,到目前为止它始终有效。 但是当我尝试使用 pdf 时我遇到了以下问题:
当我运行代码时:
import pdfquery
pdfQuery = pdfquery.PDFQuery('10241.pdf')
pdfQuery.load()
程序似乎卡住了,永远无法完成。
有人遇到过这个问题吗?或者有什么解决办法吗?
谢谢。
最佳答案
您的 PDF 有多少页?
指定要加载的页面数可能会有所帮助:
pdfQuery.load(0)
上面的代码将只加载第一页并节省时间。
关于python - pdfquery 加载问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36527938/