python - 用 Python 文本挖掘 PDF 文件？

标签 python pdf text-mining

是否有 python 的包/库可以让我打开 PDF 并在文本中搜索某些单词？

最佳答案

使用 PyPdf2你可以使用 extractText()提取 pdf 文本并对其进行处理的方法。

更新:更改文本以引用 PyPdf2，感谢@Aditya Kumar 的提醒。

关于python - 用 Python 文本挖掘 PDF 文件？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/1672202/

上一篇：python - 从不同的 Python 文件调用方法

下一篇：Python:Int 不可迭代错误

相关文章：

python - 在 NumPy 数组中概括切片操作

java - 从 JAR 为 FOP 加载字体

javascript - jsPDF、html2canvas、PHPMailer，又是...!将 PDF 附加到邮件

php - 动态生成PDF并将其存储在文件系统中？

r - Sample.int(m, k) 中的错误 : cannot take a sample larger than the population

python - 将定位器存储在变量中

python - 如何测试 Django CreateView？

python - 如何永久设置matplotlib pyplot样式？

python - 在Python中从列表的列表创建列表

r - 如何计算R中文本中的句子数？

©2024 IT工具网联系我们