python - 引发运行时错误 ('FPDF error: ' +msg) 运行时错误 : FPDF error: Unsupported image type: chapter_1_romance_dawn

标签 python python-3.x pdf urllib glob

好吧,我正在开发漫画(日本漫画)下载器。日本漫画可以在线获取,但你只能阅读,如果你想下载它们,你必须通过右键单击blah blah blah开始保存图像文件...

所以,我正在开发一个替代漫画下载器,它将下载您指定的漫画的所有章节,然后将它们转换为 pdf。

我已经完成了下载图像的代码,并且运行良好,但问题出在 pdf 转换部分。

这是我的代码

import requests
import urllib
import glob
from bs4 import BeautifulSoup
import os
from fpdf import FPDF

def download_image(url, path):
    r = requests.get(url, stream=True)
    if r.status_code == 200:
        with open(path, 'wb') as f:
            for chunk in r:
                f.write(chunk)


start_chapter = int(input("Enter Starting Chapter: "))
end_chapter = int(input("Enter Ending Chapter: "))

chapters = range(start_chapter, end_chapter + 1)
chapter_list = []

for chapter in chapters:
    chapter_list.append("https://manganelo.com/chapter/read_one_piece_manga_online_free4/chapter_" + str(chapter))

for URL in chapter_list:
    r = requests.get(URL)

    soup = BeautifulSoup(r.text, 'html.parser')
    images = soup.findAll('img')
    for i in images:
        url = i.attrs["src"]
        os.makedirs(url.split('/')[-2], exist_ok=True)
        download_image(url, os.path.join(url.split('/')[-2], url.split('/')[-1]))

pdf = FPDF()
imageList = glob.glob("*")
for image in imageList:
    pdf.add_page()
    pdf.image(image, 10, 10, 200, 300)
pdf.output("One Piece Chapter", "F")

那么,有什么建议我可以修复此错误:

raise RuntimeError('FPDF error: '+msg) RuntimeError: FPDF error: Unsupported image type: chapter_1_romance_dawn

最佳答案

首先,这是一个非常好的主意。

由于图片列表路径错误而出现错误。
您将 jpg 存储在文件夹(章节名称)中。
您所要做的就是提供 FPDF 的正确路径。

我创建了一组以避免重复。 然后我删除了“图像”和“图标”文件夹 ->也许你会使用它们?

cchapter = set()
for URL in chapter_list:
    r = requests.get(URL)

    soup = BeautifulSoup(r.text, 'html.parser')
    images = soup.findAll('img')

    for i in images:
        url = i.attrs["src"]
        cchapter.add(url.split('/')[-2])
        os.makedirs(url.split('/')[-2], exist_ok=True)
        download_image(url, os.path.join(url.split('/')[-2], url.split('/')[-1]))

cchapter.remove('images')
cchapter.remove('icons')
chapterlist = list(cchapter)
print(chapterlist[0])

def sortKeyFunc(s):
    return int(os.path.basename(s)[:-4])

for chap in chapterlist:
    pdf = FPDF()
    imageList = glob.glob(chap + "/*.jpg")
    imageList.sort(key=sortKeyFunc)
    for image in imageList:
        pdf.add_page()
        pdf.image(image, 10, 10, 200, 300)
    pdf.output(chap + ".pdf", "F")

最后我添加了一个循环来为每个文件夹创建一个 pdf...
然后将 PDF 命名为章节名称...
您还错过了我们的扩展名(“.pdf”)...
这会起作用。 :)

编辑:

glob.glob 将返回顺序不正确的文件列表。

引用:here

It is probably not sorted at all and uses the order at which entries appear in the filesystem, i.e. the one you get when using ls -U. (At least on my machine this produces the same order as listing glob matches).

因此,您可以使用文件名(在我们的例子中为数字)作为排序键。

def sortKeyFunc(s):
    return int(os.path.basename(s)[:-4])

然后在循环中添加imageList.sort(key=sortKeyFunc)

注意:代码已更新。

关于python - 引发运行时错误 ('FPDF error: ' +msg) 运行时错误 : FPDF error: Unsupported image type: chapter_1_romance_dawn,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53116930/

相关文章:

python - 使用 API 检索子项目并更新 Rally 中选定项目的父项目

python - 如何使用strided_slice选择tensorflow中的所有元素?

python - python 中机架的拼字游戏单词组合

python - 多线程应用程序中的 _wait_for_tstate_lock 错误

php - 如何下载文件并立即导出为电子邮件附件

javascript - 尝试将 php 表转换为 pdf 格式 - 使用 jsPDF-auto-table 将 php 查询结果(多条记录)转换为格式良好的 pdf 文件

SQL中集合的Python字典

Python @property 装饰器不工作

python-3.x - 如何使用包含 python3 解释器的 virtualenv 打包 pyspark 代码?

python - 使用 Python 自动下载嵌入式 PDF 文件