python - 如何使用 Python 从 pdf 文件中删除页面?

标签 python pdf

我有一些超过 500 页的 .pdf 文件,但我只需要每个文件中的几页。有必要保留文档的标题页。我确切地知道程序应该删除的页数。我如何使用安装在 MS Visual Studio 上的 Python 2.7 环境来做到这一点?

最佳答案

尝试使用 PyPDF2 .

不是删除页面,而是创建一个新文档并添加您不想删除的所有页面。

一些示例代码(最初改编自已失效的 BinPress,存档 here)。

from PyPDF2 import PdfWriter, PdfReader
pages_to_keep = [1, 2, 10] # page numbering starts from 0
infile = PdfReader('source.pdf', 'rb')
output = PdfWriter()

for i in pages_to_keep:
    p = infile.pages[i] 
    output.add_page(p)

with open('newfile.pdf', 'wb') as f:
    output.write(f)

from PyPDF2 import PdfWriter, PdfReader
pages_to_delete = [3, 4, 5] # page numbering starts from 0
infile = PdfReader('source.pdf', 'rb')
output = PdfWriter()

for i in range(len(infile.pages) ):
    if i not in pages_to_delete:
        p = infile.get_page(i)
        output.add_page(p)

with open('newfile.pdf', 'wb') as f:
    output.write(f)

关于python - 如何使用 Python 从 pdf 文件中删除页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39574096/

相关文章:

python - 字典的嵌套键值求和

Python UpSert - 参数不足

javascript - 使用PDF.js异步加载多个pdf文件时获取总页数

ios - 在 UIWebView 中查看 PDF

python - 快速迭代多维 numpy 数组中的向量

python - SupervisedDBNClassification'对象没有属性 'classes_'

Python从列表创建列表的子列表

c++ - Ghostscript api 请求 "press <return> to continue"

r - 修复针织文档输出中 ## 后的不一致间距

java - 如何在 Java(和其他)中确定 "FI"的连字