python - PDF 表单字段操作

标签 python django pdf

我正在制作一个 Web 界面,以使用数据库中的用户数据自动填充 pdf 表单。管理员需要能够上传 pdf(目前针对 IRS pdf 表单),然后将 pdf 中的字段与数据库中的数据字段相关联。

我需要一种方法来帮助管理员将字段名称(诸如“topmostSubform[0].Page2[0].p2-t66[0]”之类的东西)与数据库中的数据字段相关联。我正在寻找一种以编程方式修改 PDF 以某种方式提供此信息的方法。

基本上,我愿意接受有关如何使字段名称以明显的方式出现在原始 pdf 的修改版本上的建议。我得到的最接近的是能够通过逐行编辑原始 pdf 将工具提示插入 pdf 中的字段。然而,当以这种方式编辑 pdf 时,字段名称是乱码,所以我不能只使用它们。

最佳解决方案是可以自动解析 pdf 并将每个字段的工具提示设置为字段名称的任何方法。任何可以从命令行或任何 python 工具运行的东西,或者只是基本的如何从原始 pdf 文件正确解析字段名称的东西都会很棒。

最佳答案

可能有比这更简单的解决方案,但您绝对可以使用 http://www.reportlab.com/software/opensource/rl-toolkit/'>ReportLab 完成工作。

如果您可以将当前的税表保存为图像,则可以确定每个项目需要写入的位置并开发您的代码,以便它自动将数据库中的适当值分层到图像之上(税形式,或任何形式)。

一旦确定 1) 需要从数据库中提取哪些字段,以及 2) 它们应该在表单中的什么位置...

这基本上就是您要做的:

from reportlab.pdfgen import canvas 

report_string_values = ['Alex',500,500],['Guido',400,400],
c = canvas.Canvas('hello.pdf')
c.drawImage(background_image,x_pos,y_pos) # x_pos and w_pos are # pixels from bl origin
for rsv in report_string_values:  
    c.drawString(rsv.x_pos,rsv.,rsv.text) 
c.showPage()
c.save()

关于python - PDF 表单字段操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2588622/

相关文章:

python - 图论圣人,KeyError

python - 如何使用时间序列数据在 ggplot 中绘制面积图?

python - 如何使用 python 请求将 tar.gz 和 jar 文件作为 GitHub Assets 上传?

python - django 使用装置进行单元测试 - 对象匹配查询不存在

python - Google AppEngine、Django 和 request.FILES

java - Apache PDFBox PDF 创建中的字符间距相等

c++ - Boost python,将原始指针与托管指针进行比较?

python - 将相关资源与 TastyPie 相结合

pdf - iText 在 sandbox.stamper.SuperImpose.java 中设置创建日期和修改日期

ruby-on-rails - 使用 wicked_pdf gem 和 wkhtmltopdf 在 PDF 上显示图像标题