javascript - 如何对 PDF 文件中的文本搜索和替换进行编程

标签 javascript pdf replace

我如何能够以编程方式搜索和替换大量 PDF 文件中的某些文本?我想删除已添加到一组文件中的 URL。我已经能够在 Adob​​e Pro 的批处理下使用 javascript 删除链接,但链接文本仍然存在。我看到了使用文本修饰的建议,它可以手动工作,但我不想手动修改 1300 个文件。

最佳答案

由于文档格式的图形特性,在 PDF 中查找文本本来就很困难——您要搜索的字母在文件中可能不连续。也就是说,CAM::PDF具有一些搜索替换功能和启发式。给changepagestring.pl试试看它是否适用于您的 PDF。

安装:

 $ cpan install CAM::PDF
 # start a new terminal if this is your first cpan module
 $ changepagestring.pl input.pdf oldtext newtext output.pdf

关于javascript - 如何对 PDF 文件中的文本搜索和替换进行编程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/220445/

相关文章:

Javascript 在 "-"之前和 "."之后添加换行符

javascript - 寻找 Javascript/jQuery 事件触发器

Javascript typeof 和 IsNaN

Javascript 替换字符串中的内容(如果存在)

javascript - Jquery/Javascript 视频替换

javascript - 将 OnClick 设置为 null 后,如何在 JavaScript 中再次具有 Onclick 行为

javascript - 使用 PKCS #11 在 Webapp 中签署 PDF

asp.net-mvc - 为什么 Chrome 在这两种情况下使用不同的客户端缓存?

android - 将 PDF 文件作为邮件发送或提供应用程序以直接查看文件

python - 替换 Pandas 数据框中的字符串