使用命令行 ghostscript,是否可以删除 PDF 中重复的嵌入对象(图像)并用单个实例替换它们?
我有一个 200 多页的 PDF,每页都有背景图片和一些较小的 Logo 。该文件非常大,因为相同的背景图像和 Logo 二进制文件嵌入在每个单独的页面中,而不是嵌入一次然后在每个页面上引用。我不是 PDF 的创建者,所以我无法从源头解决问题。
(我不想缩小或降低图像质量,也不想完全删除它们。)
最佳答案
作为ghostscript的补充,pdfsizeopt
在消除 PDF 中重复的嵌入对象(包括背景图像)方面做得非常好,并且可以在 ghostscript 处理文件之前或之后运行。然而,由于它的依赖关系,将其包含在工作流中有点棘手,并且会创建很多临时文件。可以在 https://github.com/pts/pdfsizeopt 找到(原 https://code.google.com/p/pdfsizeopt/ )
仅通过删除重复图像,我的 200 多页文档就从 150MB 增加到 40MB。
关于pdf - 如何使用 ghostscript 删除 PDF 中的重复对象?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27295777/