我如何能够以编程方式搜索和替换大量 PDF 文件中的某些文本?我想删除已添加到一组文件中的 URL。我已经能够在 Adobe Pro 的批处理下使用 javascript 删除链接,但链接文本仍然存在。我看到了使用文本修饰的建议,它可以手动工作,但我不想手动修改 1300 个文件。
最佳答案
由于文档格式的图形特性,在 PDF 中查找文本本来就很困难——您要搜索的字母在文件中可能不连续。也就是说,CAM::PDF具有一些搜索替换功能和启发式。给changepagestring.pl试试看它是否适用于您的 PDF。
安装:
$ cpan install CAM::PDF
# start a new terminal if this is your first cpan module
$ changepagestring.pl input.pdf oldtext newtext output.pdf
关于javascript - 如何对 PDF 文件中的文本搜索和替换进行编程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/220445/