python - 对文件夹中的所有文件递归运行终端命令

标签 python ubuntu recursion terminal pdfbox

我正在处理一个需要我从 pdf 中提取文本的问题。为此,我正在使用 pdfbox。所以,我在终端 (linux ubuntu) 中运行这个命令:

java -jar pdfbox-app-1.8.7.jar ExtractText [path leading to file here]

一切正常。但是,我想对特定目录中的数千个文件递归执行此操作,因此我不必每次都手动插入 pdf 路径。我将不胜感激来自终端或脚本的任何解决方案。

最佳答案

使用查找命令:

find /path/to/directory -type f -exec java -jar pdfbox-app-1.8.7.jar ExtractText {} \;

关于python - 对文件夹中的所有文件递归运行终端命令,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26591367/

相关文章:

html - 如何生成用于 VideoJS 的视频预览缩略图?

ruby-on-rails-3 - 使用 Virtual Box 在 Linux 上运行 Spork for Rails - 端口使用错误

ubuntu - 安装kaldi时libmkl_tbb_thread.so相关的一个问题

python - python 对象什么时候成为垃圾收集的候选对象?

python - 我们可以在 pandas.core.groupby.SeriesGroupBy 对象中看到组数据吗

python - s3- boto- 按上传时间列出存储桶中的文件

scala - 为什么这个不可变的双向链表实现会溢出堆栈

recursion - 如何定义相互递归类型

Haskell递归列表理解导致C VoidCC VoidCC

python - Pandas:加速 groupby