python - pdfquery 加载问题

标签 python pdf

我在 python 中使用 pdfquery 库来提取文本。为此,我加载了 pdf,到目前为止它始终有效。 但是当我尝试使用 pdf 时我遇到了以下问题:

当我运行代码时:

import pdfquery
pdfQuery = pdfquery.PDFQuery('10241.pdf')
pdfQuery.load()

程序似乎卡住了,永远无法完成。

有人遇到过这个问题吗?或者有什么解决办法吗?

谢谢。

最佳答案

您的 PDF 有多少页?

指定要加载的页面数可能会有所帮助:

pdfQuery.load(0)

上面的代码将只加载第一页并节省时间。

关于python - pdfquery 加载问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36527938/

相关文章:

python - 从 PDF 中提取页眉/页脚(以编程方式)

shell - pdftk中无法旋转

python - 基于另一列 str 的条件字符串分割 Python

pdf - PhantomJS PDF DPI 缩放问题

python - 名称错误 : name 'MainCorridor' is not defined

如果 'dialog-bmp' 是 'dialog-bmp',Python 将返回 false

java - 如何使用 iText 获取 AcroField 属性?

java - 我们的加密 PDF 被黑了

python - 从 scrapy 中获取 None

python - Cython/python - cdef 类列表