python - pdfminer3从pdf中提取不带空格的文本

标签 python pdf pdfminer

pdfminer3 是从 pdf 中提取文本的简单工具。在浏览引用 minimal reproducible example 时,面临提取文本中空格缺失的问题。

最佳答案

解决方案是指定 laparams 接下来的方式

from pdfminer3.layout import LAParams
converter = TextConverter(resource_manager, fake_file_handle, laparams=LAParams())

关于python - pdfminer3从pdf中提取不带空格的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58889337/

相关文章:

python - jinja2 模板的多个渲染?

excel - 离线数据输入选项

python - Python PDFMiner 库中不存在 PDFPage

python - 如何调整 'word_margin' 以便在 python 中使用 pdfminer 读取 PDF?

python - 如何从概念上处理 python 中的异常?

python - 将字符串与列表匹配以迭代检索

python - 使用同一模型创建两个不同的表

c# - 打印发票至 PDF

wpf - WPF 的 ComponentOne : Text seems to render in the incorrect position?

Python 写入文件时出现 UnicodeEncodeError