python - PDF 叠加不起作用

标签 python pdf pypdf

我一直在寻找解决这个问题的方法:我有两个带有图像的横向 A3 pdf,我想以一种方式覆盖它们,使生成的 pdf 包含两个图像合并为一个,就好像其中一个是水印,但密度相同。把它想象成在一张 A3 纸上打印两个不同的 pdf 文件,我想要得到完全一样的效果。

换句话说 - 只是想出了一种表达方式 - 我想叠加两个 pdf 并且对于上层,使所有“白色”区域透明。

基本上,我只是按照这个问题的任何解决方案中的步骤操作:

overlay one pdf or ps file on top of another

pdftk 在我的案例中不起作用。生成的 PDF 显示位于顶层的 pdf,但看不到底层。因此,我继续编程解决方案并下载了 pyPdf。

该站点的代码正是所需解决方案的实现:

 from pyPdf import PdfFileReader,PdfFileWriter
 output = PdfFileWriter()
 input1 = PdfFileReader(file("b.pdf", "rb"))

 page1 = input1.getPage(0)
 watermark = PdfFileReader(file("a.pdf", "rb"))
 page1.mergePage(watermark.getPage(0))

 output.addPage(page1)

 outputStream = file("c.pdf", "wb")
 output.write(outputStream)
 outputStream.close()

但是和使用pdftk后的结果是一样的。

我做错了什么?也许这不是 pdf 合并、多重合并、冲压、覆盖等,而是其他什么?如果是这样,它怎么称呼?

最佳答案

pdf 中的

白色 可能是两种基本情况的结果:要么是没有在那里绘制任何东西,要么是使用有效颜色白色在那里绘制了某些东西。可以使用这些页面合并方法为第一种类型的 PDF 提供背景,而后一种类型的 PDF 则不能。

示例文件 a.pdf 页面的内容流是这样开始的:

1 0 0 -1 0 841 cm
0.45 0 0 0.45 0 0 cm
1 0 0 1 0 0 cm
0 0 m 2646 0 l 2646 1870 l 0 1870 l h
q
1 1 1 rg f
Q

前三行改变操作坐标系,以左上角为原点,坐标值向右向下递增,单位为1/160英寸。

第四行绘制了一个覆盖整个页面的矩形(实际上甚至略多),第六行用白色填充该矩形。 (第五行和第七行只是保存和恢复图形状态。)

因此,通过将此 PDF 覆盖在另一个 PDF 的页面上,此 PDF 首先用白色矩形覆盖该页面的所有现有内容。

因此,不能通过简单地将页面内容添加到背景 PDF 页面的内容来为您的 PDF 提供背景。你必须

  • 要么先从该内容中删除第 4 行和第 6 行(也许 lucidchart 中有一些复选框允许您打开或关闭这个白色背景矩形)
  • 或使用不同的水印程序(比如反过来,使用透明度将带有水印的 PDF 页面覆盖在您的 PDF 页面上)。

PS:严格来说,这些内容行已经是错误的:一旦您开始构建路径(在上面的示例中发生 0 0 m,即移动到位置 0, 0),你只能使用路径构建(或路径裁剪)操作,直到你最终使用路径绘制运算符(f,即 fill ,在你的样本中)。比照。 this answer供引用。

因此,颜色设置 1 1 1 rg(即 将填充颜色设置为 RGB 100%、100%、100%)和特殊的图形状态操作 q (保存图形状态) 操作在这里是不允许的。因此,根据 PDF 查看器的不同,显示该页面时可能会发生不同的事情,例如填充操作可能会被完全忽略,或者可能只是颜色设置操作,而可能会使用当前的填充颜色(黑色?)。不能指望所有 PDF 查看器都能像 Adob​​e Reader 那样处理此错误。

也许 lucidchart 已经解决了这个问题并且更新就足够了。否则,您应该要求 lucidchart 开始正确制作他们的 PDF 图表。

关于python - PDF 叠加不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23584709/

相关文章:

python - 增加 Python 新整数类型的惯用方法是什么?

php - "visibility:hidden;"不适用于 TCPDF

java - 用于将现有PDF转换为PDF/A的免费Java库

java - Android - Spinner 异步下载文件不保存

Python PDF 直接读取它在 PDF 中的样子

python - PyPDF2,如何修复其示例代码以符合 Python 3

python - 即使使用队列也无法按广度搜索

python - PrettyPrinter - 从开始和结束括号开始在单独的行上打印输出

python - 什么时候 Py_INCREF?

pypdf - Python PyPDF - 未找到 EOF 标记