java - 是否可以将一个或多个基于 XFA 表单的 PDF 文件与 iText 附加或合并在一起?

标签 java pdf itext

我有一个 PDF 文件,其中包含基于 XFA (XML) 表单的嵌入式表单。第一个 PDF 有一个包含人员列表的表格。如果该表溢出,后续人员列表将由附录页处理,该附录页也是 PDF(基于 XFA 的表格)。是否可以使用 iText 将所有基于 XFA 的 PDF 合并为一个 PDF?

最佳答案

@BrunoLowagie 感谢您的回复。实际上,我设法让 iText 连接 PDF 交互式表单来创建自定义 PDF 数据包。让我解释一下我是如何做到这一点的。

通过使用 Adob​​e Acrobat XI Pro,我了解到,当加载 XFA PDF 时,如果我转到“工具”->“编辑”,则无法编辑表单(它会向我发出通常的警告,表明该 PDF 是由 LiveCycle Designer 创建的),但是当我转到“页面”->“提取”,然后选择要提取的所有页面时,整个基于 XFA 的 PDF 将被提取并转换为基于 AcroForms 的 PDF。因此,如果我在基于 XFA 的 PDF 中有 25 个字段,它已成功将所有 25 个字段转换为 AcroForm 字段。 Adobe Acrobat 必须以某种方式根据 XML 结构确定变量名称。 (即xpath)//form1/Page1/variable1被转换为acro字段名称:form1[0].Page1[0].variable1[0]。所有可见(可编辑表单)字段都像往常一样存在并对齐(像素完美)。

如果我将 XFA PDF 展平,我将再次需要将表单字段放回每个页面上,这将是乏味的。通过使用“页面”->“提取”->“所有页面”,它可以为我转换所有内容(不需要展平 - 展平也会剥离所有字段;也不需要 XFA 工作库)。

但是,我的 PDF 数据包是静态的,我想重复附录页,以防数据从第二页溢出。我知道我可以修改初始 XFA 来处理此溢出,但客户希望使用精确的页面外观来查找附录,并且页眉/页脚完好无损。

我发现可以通过 Adob​​e Acrobat Pro->Pages->Extract->(选择附录页面)单独提取附录页面来实现此目的,然后将其完整转换为带有 AcroForm 的 PDF 表单。

我获取了原始 PDF 数据包并尝试连接附录 PDF 页面。因此目前,主数据包具有 AcroForm 字段,附录 PDF 页面也具有 AcroForm 字段。

当我使用 PdfCopy 或 PdfConcatenate 进行串联时,我注意到在调用 form.getFields() 时丢失了所有表单字段

当我使用(已弃用的)PdfCopyFields 进行串联时,所有 AcroForm 字段都完好无损。 (正是我需要的!)我还测试了 PdfCopyFields,其中填充/保存了一些字段,并且 PdfCopyFields 仍然有效并继承了预填充的值。我查看了 PdfCopyFields 被标记为弃用的原因,说我们可以合并可访问的文件并丢失表单,或者合并表单或丢失可访问性(标记的 PDF)。如果我不关心带标签的 PDF 或可访问性怎么办?...并且仍然需要 PDFCopyFields 来完整保留表单字段。到目前为止,我被迫继续使用 PDFCopyFields,因为它完全满足了我将 PDF 与交互式表单字段连接的需要。如果 PDFCopyFields 消失,是否可以更新 PDFCopy 以选择复制字段?

关于java - 是否可以将一个或多个基于 XFA 表单的 PDF 文件与 iText 附加或合并在一起?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28199708/

相关文章:

java - Java 文件对象可以是 linux 机器上 "Too many files open"错误消息的原因吗

java - JMM 在实践中

java - 我可以在没有明确提供 XSL 文件的情况下进行 XSL 转换吗?

java - Spring看不到我导入的类

java - 在方法中创建作用域的最简单方法是什么?

php - HTML2pdf CSS 不支持

css - 如何在 headless Chrome 中更改纸张大小 --print-to-pdf

c# - 如何将 PDF 文件拆分成页面(最好是 C#)

java - iText 5.5.0 与 XDocReport 1.0.4

java - 如何为 itext 中的 block 或短语提供对齐方式?