java - PDFBox - "saveIncremental"插入第二张图像后不起作用

标签 java pdf pdfbox

我在使用 PDFBox 时遇到问题。我的 PDF 中有一个空白页,我想在其中插入图像。因为我还使用签名的 PDF,所以所有更改都必须保存为“saveIncremental”。

当我只插入一张图像时,一切都很好(图像已插入)。当我尝试在此 PDF 中插入另一张图像时,该图像尚未插入,并且在 Adob​​e Acrobat Reader 中打开时显示“此页面存在错误。Adobe 可能无法正确显示该页面...”。

奇怪的事情 - 当 PDF 不仅是空白页,而且例如带图像的空白页,一切都很好(第一张和第二张图像已使用 saveIncremental 正确插入)。

插入和保存图片代码:

PDImageXObject pdImage = PDImageXObject.createFromFile(tmpSig.getFileName(), doc);
PDPageContentStream contentStream = new PDPageContentStream(doc, tmpPage, PDPageContentStream.AppendMode.APPEND, true, true);
contentStream.drawImage(pdImage, finalX, (finalPageHeight - finalY - finalHeight), finalWidth, finalHeight);
contentStream.close();

// update before save
tmpPage.getCOSObject().setNeedToBeUpdated(true);
tmpPage.getResources().getCOSObject().setNeedToBeUpdated(true);
doc.getDocumentCatalog().getPages().getCOSObject().setNeedToBeUpdated(true);
doc.getDocumentCatalog().getCOSObject().setNeedToBeUpdated(true);

// save
doc.saveIncremental(new FileOutputStream(pdfFile));

所有可用文件 here

使用 PDFBox 版本 2.0.7,但我也尝试了最新版本(2.0.15),但没有帮助。

感谢您的所有想法!

<小时/>

编辑: 我尝试像这样更新 XObject 和资源(在注释“保存前更新”下添加此代码):

pdImage.getCOSObject().setNeedToBeUpdated(true);
PDResources pdResources = tmpPage.getResources();
for (COSName name : pdResources.getXObjectNames()) {
    pdResources.getXObject(name).getCOSObject().setNeedToBeUpdated(true);
}

问题仍然存在,没有任何改变......

最佳答案

除了您已标记为已更新的词典

tmpPage.getCOSObject().setNeedToBeUpdated(true);
tmpPage.getResources().getCOSObject().setNeedToBeUpdated(true);
doc.getDocumentCatalog().getPages().getCOSObject().setNeedToBeUpdated(true);
doc.getDocumentCatalog().getCOSObject().setNeedToBeUpdated(true);

请将资源字典中的 XObject 条目标记为已更新:

tmpPage.getResources().getCOSObject().getCOSDictionary(COSName.XOBJECT).setNeedToBeUpdated(true);
<小时/>

您想知道为什么在添加第一个图像时不需要这样做?

在原始 PDF 中,资源字典中还没有 XObject 条目。因此,它是重新生成的,因此隐式标记为已更新。

您想知道为什么在添加到已有图像的文件时不需要这样做?

在该其他文件中,资源字典中的 XObject 条目是直接对象,即它立即包含在资源字典中。

4 0 obj
<<
  /Type /Page
  /Resources <<
    /ProcSets [/PDF /Text /ImageB /ImageC /ImageI]
    /ExtGState <</G3 5 0 R /gs2 6 0 R /gs3 7 0 R>>
    /XObject <</Im1 8 0 R /Im2 9 0 R>>
  >>
  /MediaBox [0 0 611.03998 864.95996]
  /Contents [10 0 R 11 0 R 12 0 R 13 0 R 14 0 R]
  /StructParents 0
  /Parent 2 0 R
>> 
endobj

因此,每当写入资源字典的新副本时,也会隐式写入 XObject 条目的新副本。

但是,在 PDFBox 在资源字典中创建 XObject 条目的文件中,PDFBox 将其创建为间接对象,即在资源字典中 XObject 仅映射指向对象编号的引用,并且在具有该编号的对象中可以找到实际的条目字典。

2 0 obj
<<
  /Type /Page
  /Resources <<
    /ProcSets [/PDF /Text /ImageB /ImageC /ImageI]
    /ExtGState <</G3 3 0 R>>
    /XObject 7 0 R
  >>
  /MediaBox [0 0 611.03998 864.95996]
  /Contents [8 0 R 4 0 R 9 0 R]
  /StructParents 0
  /Parent 5 0 R
>>
endobj
7 0 obj
<<
  /Im1 10 0 R
>> 
endobj

因此,当写入资源字典的新副本时,在这种情况下不会写入 XObject 条目字典的隐式新副本。

<小时/>

顺便说一句,您当前的方法不会帮助您完成任务

Because I also work with signed PDFs, all changes have to be saved as "saveIncremental".

不允许将图像添加到页面内容中对已签名的 PDF 进行更改,因此 Adob​​e Reader 仍会指示您的签名无效。有关签名后允许和不允许的更改的摘要,请查看 this answer以及从中引用的文档。

您应该尝试在注释中添加图像。

关于java - PDFBox - "saveIncremental"插入第二张图像后不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56024623/

相关文章:

Java 在具有两种类型的 Map 上使用泛型

c# - 获取 PDF 文件中的超链接列表

java - PDFBox 使文本不可见

java - 如何使用 PdfBox 生成分层 pdf 文件?

java - PDF 解析器文本包含

java - 如何在swing中将元素添加到JList?

java - Java编译器优化

java - 如何获取 Java 数组对象的大小 O(1)?

javascript - 使用 Shrimp AngularJS 将 View 转为 pdf

pdf - 使用 R 中的脚本生成 pdf 时出错