我们的 Django 应用程序需要对上传的 PDF 文件执行一些操作:
- 验证文件是否为 PDF 文件且未损坏
- 检查文件是否未加密
- 计算页数
我们遇到了一个不幸的流行应用程序的问题,该应用程序的未加密 PDF 导出实际上是一个加密的 PDF 文件,只是密码为空。迄今为止,我们一直在使用 PyPDF,但它无法读取这些文件,因为加密是非标准的。导出这些文件的应用程序在我们的用户中非常流行,这是一个痛苦。
另一个应用程序导出的文件具有错误的 MIME 类型(除 application/pdf
之外的其他内容),因此我们最终使用的任何内容都需要能够应对此类愚蠢的瓶颈。
是否有一个我们可以利用的积极维护的、强大的 PDF 库?甚至 PDFtk(一些人一直推荐的 CLI 实用程序)最近一次更新也是在 2006 年。
感谢任何帮助。
更新:澄清一下,它可以是免费的,也可以是付费的。建议您认为最好的选择。
最佳答案
PDFlib很棒,但是要花钱。你没有说它必须是免费的,尽管我隐含地认为你希望它是免费的! :)
关于python - 在 Django 应用程序中处理上传的 PDF 文件有哪些不同的选项?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1390371/