python - BeautifulSoup - urllib.error.HTTPError : HTTP Error 403: Forbidden

标签 python beautifulsoup urllib

我尝试使用 urrlib 下载 GIF 文件,但它抛出此错误:

urllib.error.HTTPError: HTTP Error 403: Forbidden

当我从其他博客网站下载时,不会发生这种情况。这是我的代码:

import requests
import urllib.request

url_1 = 'https://goodlogo.com/images/logos/small/nike_classic_logo_2355.gif'

source_code = requests.get(url_1,headers = {'User-Agent': 'Mozilla/5.0'})    

path = 'C:/Users/roysu/Desktop/src_code/Python_projects/python/web_scrap/myPath/'

full_name = path + ".gif"    
urllib.request.urlretrieve(url_1,full_name)

最佳答案

不要使用urllib.request.urlretrieve。相反,请使用 requests 库,如下所示:

import requests

url = 'https://goodlogo.com/images/logos/small/nike_classic_logo_2355.gif'

path = "D:\\Test.gif"

response = requests.get(url, headers={'User-Agent': 'Mozilla/5.0'})

file = open(path, "wb")

file.write(response.content)

file.close()

输出:

enter image description here

希望这有帮助!

关于python - BeautifulSoup - urllib.error.HTTPError : HTTP Error 403: Forbidden,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64274098/

相关文章:

python - 如何在使用 CNTK 训练期间直接访问梯度和修改权重(参数)?

python - 如何将 utf-8 字符从 python 保存到 mySQL

python - Python 条件运算符解决方法如何工作?

python - 获取文本并删除所有标签,但保留标题和粗体的标签

Python BeautifulSoup - 抓取 Div Spans 和 p 标签 - 以及如何获得 div 名称的精确匹配

python - 无法访问 Project Gutenberg 原始文本

python - get(self) 恰好接受 1 个参数,提供 2 个参数 - NOT

python - 抓取 URL 和嵌套 CSV 以与 python 结合时出现问题

http - 当 python3 抛出 HTTPError 时,如何获取 http 正文

Python HTTP 错误 429 与 urllib2