如何搜索 pdf 文件中的单词或行?
是否有现有的模块可以简洁地做到这一点?
提前谢谢您,
最佳答案
有一个叫做 pyPDF. 的东西
它是一个作为 PDF 工具包构建的
Pure-Python
库。
您可以提取(使用 extractText()
方法)并使用以下代码对 pdf 文件执行搜索。
pdf = pyPdf.PdfFileReader(file(path, "rb"))
content = pdf.getPage(1).extractText()
关于python - 使用 python 生成 pdf 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5263250/