好吧,我正在开发漫画(日本漫画)下载器。日本漫画可以在线获取,但你只能阅读,如果你想下载它们,你必须通过右键单击blah blah blah开始保存图像文件...
所以,我正在开发一个替代漫画下载器,它将下载您指定的漫画的所有章节,然后将它们转换为 pdf。
我已经完成了下载图像的代码,并且运行良好,但问题出在 pdf 转换部分。
这是我的代码
import requests
import urllib
import glob
from bs4 import BeautifulSoup
import os
from fpdf import FPDF
def download_image(url, path):
r = requests.get(url, stream=True)
if r.status_code == 200:
with open(path, 'wb') as f:
for chunk in r:
f.write(chunk)
start_chapter = int(input("Enter Starting Chapter: "))
end_chapter = int(input("Enter Ending Chapter: "))
chapters = range(start_chapter, end_chapter + 1)
chapter_list = []
for chapter in chapters:
chapter_list.append("https://manganelo.com/chapter/read_one_piece_manga_online_free4/chapter_" + str(chapter))
for URL in chapter_list:
r = requests.get(URL)
soup = BeautifulSoup(r.text, 'html.parser')
images = soup.findAll('img')
for i in images:
url = i.attrs["src"]
os.makedirs(url.split('/')[-2], exist_ok=True)
download_image(url, os.path.join(url.split('/')[-2], url.split('/')[-1]))
pdf = FPDF()
imageList = glob.glob("*")
for image in imageList:
pdf.add_page()
pdf.image(image, 10, 10, 200, 300)
pdf.output("One Piece Chapter", "F")
那么,有什么建议我可以修复此错误:
raise RuntimeError('FPDF error: '+msg) RuntimeError: FPDF error: Unsupported image type: chapter_1_romance_dawn
最佳答案
首先,这是一个非常好的主意。
由于图片列表路径错误而出现错误。
您将 jpg 存储在文件夹(章节名称)中。
您所要做的就是提供 FPDF 的正确路径。
我创建了一组以避免重复。 然后我删除了“图像”和“图标”文件夹 ->也许你会使用它们?
cchapter = set()
for URL in chapter_list:
r = requests.get(URL)
soup = BeautifulSoup(r.text, 'html.parser')
images = soup.findAll('img')
for i in images:
url = i.attrs["src"]
cchapter.add(url.split('/')[-2])
os.makedirs(url.split('/')[-2], exist_ok=True)
download_image(url, os.path.join(url.split('/')[-2], url.split('/')[-1]))
cchapter.remove('images')
cchapter.remove('icons')
chapterlist = list(cchapter)
print(chapterlist[0])
def sortKeyFunc(s):
return int(os.path.basename(s)[:-4])
for chap in chapterlist:
pdf = FPDF()
imageList = glob.glob(chap + "/*.jpg")
imageList.sort(key=sortKeyFunc)
for image in imageList:
pdf.add_page()
pdf.image(image, 10, 10, 200, 300)
pdf.output(chap + ".pdf", "F")
最后我添加了一个循环来为每个文件夹创建一个 pdf...
然后将 PDF 命名为章节名称...
您还错过了我们的扩展名(“.pdf”)...
这会起作用。 :)
编辑:
glob.glob
将返回顺序不正确的文件列表。
引用:here
It is probably not sorted at all and uses the order at which entries appear in the filesystem, i.e. the one you get when using ls -U. (At least on my machine this produces the same order as listing glob matches).
因此,您可以使用文件名(在我们的例子中为数字)作为排序键。
def sortKeyFunc(s):
return int(os.path.basename(s)[:-4])
然后在循环中添加imageList.sort(key=sortKeyFunc)
。
注意:代码已更新。
关于python - 引发运行时错误 ('FPDF error: ' +msg) 运行时错误 : FPDF error: Unsupported image type: chapter_1_romance_dawn,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53116930/