我有一些超过 500 页的 .pdf 文件,但我只需要每个文件中的几页。有必要保留文档的标题页。我确切地知道程序应该删除的页数。我如何使用安装在 MS Visual Studio 上的 Python 2.7 环境来做到这一点?
最佳答案
尝试使用 PyPDF2 .
不是删除页面,而是创建一个新文档并添加您不想删除的所有页面。
一些示例代码(最初改编自已失效的 BinPress,存档 here)。
from PyPDF2 import PdfWriter, PdfReader
pages_to_keep = [1, 2, 10] # page numbering starts from 0
infile = PdfReader('source.pdf', 'rb')
output = PdfWriter()
for i in pages_to_keep:
p = infile.pages[i]
output.add_page(p)
with open('newfile.pdf', 'wb') as f:
output.write(f)
或
from PyPDF2 import PdfWriter, PdfReader
pages_to_delete = [3, 4, 5] # page numbering starts from 0
infile = PdfReader('source.pdf', 'rb')
output = PdfWriter()
for i in range(len(infile.pages) ):
if i not in pages_to_delete:
p = infile.get_page(i)
output.add_page(p)
with open('newfile.pdf', 'wb') as f:
output.write(f)
关于python - 如何使用 Python 从 pdf 文件中删除页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39574096/