python - PDF 表单字段操作

标签 python django pdf

我正在制作一个 Web 界面,以使用数据库中的用户数据自动填充 pdf 表单。管理员需要能够上传 pdf(目前针对 IRS pdf 表单),然后将 pdf 中的字段与数据库中的数据字段相关联。

我需要一种方法来帮助管理员将字段名称(诸如“topmostSubform[0].Page2[0].p2-t66[0]”之类的东西)与数据库中的数据字段相关联。我正在寻找一种以编程方式修改 PDF 以某种方式提供此信息的方法。

基本上,我愿意接受有关如何使字段名称以明显的方式出现在原始 pdf 的修改版本上的建议。我得到的最接近的是能够通过逐行编辑原始 pdf 将工具提示插入 pdf 中的字段。然而,当以这种方式编辑 pdf 时,字段名称是乱码,所以我不能只使用它们。

最佳解决方案是可以自动解析 pdf 并将每个字段的工具提示设置为字段名称的任何方法。任何可以从命令行或任何 python 工具运行的东西,或者只是基本的如何从原始 pdf 文件正确解析字段名称的东西都会很棒。

最佳答案

可能有比这更简单的解决方案,但您绝对可以使用 http://www.reportlab.com/software/opensource/rl-toolkit/'>ReportLab 完成工作。

如果您可以将当前的税表保存为图像,则可以确定每个项目需要写入的位置并开发您的代码,以便它自动将数据库中的适当值分层到图像之上(税形式,或任何形式)。

一旦确定 1) 需要从数据库中提取哪些字段,以及 2) 它们应该在表单中的什么位置...

这基本上就是您要做的:

from reportlab.pdfgen import canvas 

report_string_values = ['Alex',500,500],['Guido',400,400],
c = canvas.Canvas('hello.pdf')
c.drawImage(background_image,x_pos,y_pos) # x_pos and w_pos are # pixels from bl origin
for rsv in report_string_values:  
    c.drawString(rsv.x_pos,rsv.,rsv.text) 
c.showPage()
c.save()

关于python - PDF 表单字段操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2588622/

相关文章:

python - Django 1.9 中的模型。类型错误 : __init__() got multiple values for argument 'verbose_name'

python - Django 中是否可以继承多个抽象基类?

python - 使用 python 3.8+(默认协议(protocol) = 5)时,pickle.load 在来自 python 3.7 的(协议(protocol) = 4)对象上失败

python - 用特定类型的值表示 Enum 的正确方法

python - 检索指定函数接受的参数的名称(和默认值)

python - 如何将 Django 数据库中的模板标签解释/渲染为 HTML

ruby-on-rails - 如何使用wicked_pdf在pdf中加载Css

python - 如何使用 Python 从 pdf 文件中删除页面?

javascript - #Zoom=75 PDF 不适用于 Safari

python - 从服务器端模型生成无状态客户端表单?