python - 用 Python 文本挖掘 PDF 文件?

标签 python pdf text-mining

是否有 python 的包/库可以让我打开 PDF 并在文本中搜索某些单词?

最佳答案

使用 PyPdf2你可以使用 extractText()提取 pdf 文本并对其进行处理的方法。

更新:更改文本以引用 PyPdf2,感谢@Aditya Kumar 的提醒。

关于python - 用 Python 文本挖掘 PDF 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1672202/

相关文章:

python - 在 NumPy 数组中概括切片操作

java - 从 JAR 为 FOP 加载字体

javascript - jsPDF、html2canvas、PHPMailer,又是...!将 PDF 附加到邮件

php - 动态生成PDF并将其存储在文件系统中?

r - Sample.int(m, k) 中的错误 : cannot take a sample larger than the population

python - 将定位器存储在变量中

python - 如何测试 Django CreateView?

python - 如何永久设置matplotlib pyplot样式?

python - 在Python中从列表的列表创建列表

r - 如何计算R中文本中的句子数?