python - 用 Python 替换 PDF 文档中的图像?

标签 python pdf rgb cmyk

我们使用存储在 CMS 中的 RGB 图像生成 PDF 文档。

作为 PDF 处理的一部分,我们有时需要转换 RGB 图像 到 CMYK(用于打印制作)。

使用 Python 将图像从 RGB 转换为 CMYK 似乎是可行的 使用 LittleCMS 和 PyLittleCMS 绑定(bind)(加上 RGB 输入和 CMYK 输出设备的 ICC 颜色配置文件)。

但是,是否有一些基于 Python 的选项可以迭代 PDF 中的图像,提取图像数据并将它们替换为经过处理的 CMYK 变体?

最佳答案

我认为没有任何免费的 Python 工具可以完全满足您的需求。以下是一些选项:

PoDoFo没有成熟的 Python 绑定(bind),但可以读写 PDF,有 support for PDF images and color spaces .

PDFMiner是一个纯 Python 的 PDF 解析器,但它对图像的处理不多。这是一个开始,但可能需要相当多的工作才能完成您想要的。

ReportLab 的商业版本可以用 PageCatcher 做你想做的事;我几年没用过它了,但你可以调查一下。 (免费的 ReportLab 只能编写 PDF,不能阅读它们。)

关于python - 用 Python 替换 PDF 文档中的图像?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5799842/

相关文章:

jquery css 颜色值返回 RGB?

python - 如何杀死这个threading.Timer?

python - 将嵌套元组的 Pandas 列拆分/提取为多个列

python - cProfile 将数据保存到文件会导致字符困惑

php - FPDF,从 mysql 表生成选定值的 pdf

python - 如何在 Bokeh 中显示 TIFF 图像?

video - 通过片段着色器进行 YUV 转换

python - 基本 Python 类

ruby-on-rails - 如何验证下载的文件格式

Linux命令行将pdf转excel