python - 在 Django 应用程序中处理上传的 PDF 文件有哪些不同的选项?

标签 python django pdf

我们的 Django 应用程序需要对上传的 PDF 文件执行一些操作:

  1. 验证文件是否为 PDF 文件且未损坏
  2. 检查文件是否未加密
  3. 计算页数

我们遇到了一个不幸的流行应用程序的问题,该应用程序的未加密 PDF 导出实际上是一个加密的 PDF 文件,只是密码为空。迄今为止,我们一直在使用 PyPDF,但它无法读取这些文件,因为加密是非标准的。导出这些文件的应用程序在我们的用户中非常流行,这是一个痛苦。

另一个应用程序导出的文件具有错误的 MIME 类型(除 application/pdf 之外的其他内容),因此我们最终使用的任何内容都需要能够应对此类愚蠢的瓶颈。

是否有一个我们可以利用的积极维护的、强大的 PDF 库?甚至 PDFtk(一些人一直推荐的 CLI 实用程序)最近一次更新也是在 2006 年。

感谢任何帮助。

更新:澄清一下,它可以是免费的,也可以是付费的。建议您认为最好的选择。

最佳答案

PDFlib很棒,但是要花钱。你没有说它必须是免费的,尽管我隐含地认为你希望它是免费的! :)

关于python - 在 Django 应用程序中处理上传的 PDF 文件有哪些不同的选项?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1390371/

相关文章:

python - Python 中更容易的流控制

python - 返回句子中某个字符串的索引号

Django:替代使用 annotate(Count()) 来提高速度

python - Python中的关键字提取

java - 如何使用 PdfBox 缩放 pdf 文件

python - 合并两个数据框,但仅显示一条记录上的合并数据

python - 如何在 Jupyter Notebook 中将 python 升级到 3.8?

django - 从 S3 wagtail 提供静态和媒体文件

linux - Ghostscript:拆分大型 PDF 会导致 "pdfmark destination page"错误

python - 使用 pyPdf 生成的 PDF 文件无法打开