python - 使用 Python 将 PDF 文件读取为文本

标签 python pdf

错误

Traceback (most recent call last): File "C:/Users/XXX/pdf_to_text.py", line 7, in module import slate

File "C:\Python27\lib\site-packages\slate__init__.py", line 48, in from slate import PDF File "C:\Python27\lib\site-packages\slate\slate.py", line 3, in module

from pdfminer.pdfparser import PDFParser, PDFDocument

ImportError: cannot import name PDFDocument

代码:

import slate
with open('C:\Users\XXX\XXX.pdf', 'rb') as f:
pdf_text = slate.PDF(f)
print pdf_text

有人可以建议如何解决此错误吗?

我想使用 Python 读取 .PDF 文件文本内容。

最佳答案

您需要安装正确的pdfminer版本。似乎您所拥有的没有定义 PDFDocument 这就是您收到 ImportError 的原因。检查 slate 中的依赖项并获取正确的版本。

您可以通过以下方式检查现有版本

pip list

关于python - 使用 Python 将 PDF 文件读取为文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42972320/

相关文章:

python - 如何根据多列的值拆分数据框

c# - 如何使用 iTextSharp 为页面添加边框?

android - React PWA 无法在 Chrome 中打开外部 PDF(Android)

C# : We application : Where to store generated PDF files?

iphone - 显示带有视频和链接的 PDF

r - 为什么 Inkscape 无法正确读取 R 生成的 PDF 文件?

php - python 中的混淆值

Python - 通过移动极差求和所有值

python - 如何从 python 中的 df 中提取每小时数据?

java - 树结构的正则表达式?