python - 如何将多页 PDF 转换为 Python 中的图像对象列表?

标签 python image image-processing wand

我想将多页 PDF 文档转换为列表结构中的一系列图像对象,而不用 Python 将图像保存在磁盘中(我想使用 PIL Image 处理它们)。到目前为止,我只能先将图像写入文件:

from wand.image import Image

with Image(filename='source.pdf') as img:

    with img.convert('png') as converted:
        converted.save(filename='pyout/page.png')

但是我怎样才能将上面的 img 对象直接转换为 PIL.Image 对象列表呢?

最佳答案

新答案:

pip 安装 pdf2image

from pdf2image import convert_from_path, convert_from_bytes
images = convert_from_path('/path/to/my.pdf')

您可能还需要安装枕头。这可能只适用于 Linux。

https://github.com/Belval/pdf2image

两种方法的结果可能不同。

旧答案:

python 3.4:

from PIL import Image
from wand.image import Image as wimage
import os
import io

if __name__ == "__main__":
    filepath = "fill this in"
    assert os.path.exists(filepath)
    page_images = []
    with wimage(filename=filepath, resolution=200) as img:
        for page_wand_image_seq in img.sequence:
            page_wand_image = wimage(page_wand_image_seq)
            page_jpeg_bytes = page_wand_image.make_blob(format="jpeg")
            page_jpeg_data = io.BytesIO(page_jpeg_bytes)
            page_image = Image.open(page_jpeg_data)
            page_images.append(page_image)

最后,您可以对 mogrify 进行系统调用,但这可能会更复杂,因为您需要管理临时文件。

关于python - 如何将多页 PDF 转换为 Python 中的图像对象列表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43064124/

相关文章:

python - 将字符串封闭列表转换为列表

python - list_filters 的 Django raw_id_field 样式小部件

matlab - 如何计算矩阵中1和0的个数?

python - 如何使用机器学习(Tensorflow)使用新数据集构建图像处理模型?

python - OpenCV 匹配模板

Python 仅记录来自脚本的日志

android - 在android imageview中旋转缩放拖动图像

css - 为什么背景图片不显示?

javascript - 如何使用AJAX调用刷新img src

python - 如何使用opencv对齐多个相机图像