我正在处理一个需要我从 pdf 中提取文本的问题。为此,我正在使用 pdfbox。所以,我在终端 (linux ubuntu) 中运行这个命令:
java -jar pdfbox-app-1.8.7.jar ExtractText [path leading to file here]
一切正常。但是,我想对特定目录中的数千个文件递归执行此操作,因此我不必每次都手动插入 pdf 路径。我将不胜感激来自终端或脚本的任何解决方案。
最佳答案
使用查找
命令:
find /path/to/directory -type f -exec java -jar pdfbox-app-1.8.7.jar ExtractText {} \;
关于python - 对文件夹中的所有文件递归运行终端命令,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26591367/