python - 如何检查 URL 是否可下载?

标签 python python-3.x url web-scraping python-requests

如何使用 Python 检查给定的 url 是否可下载?

它应该返回 True如果可以下载,否则 False
不可下载的 url 示例:www.google.com
注:我不是在谈论 URL 的内容并将其保存为网页。

什么是可下载的 URL?

如果您重定向到一个 URL 并且文件开始下载,那么它就是一个可下载的 url

示例: https://drive.google.com/uc?id=1QOmVDpd8hcVYqqUXDXf68UMDWQZP0wQV&export=download

注:它下载 stackoverflow 年度调查 2019 数据集。

最佳答案

这可以通过使用流行的请求库来完成

import requests
url = 'https://www.google.com'
headers=requests.head(url).headers
downloadable = 'attachment' in headers.get('Content-Disposition', '')

Content Disposition Header reference

关于python - 如何检查 URL 是否可下载?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61629856/

相关文章:

Amazon S3 上的 URL 指纹缓存

java - Scala:围绕建议或 Python 装饰器实现 Java 的 AspectJ

python-3.x - 如何使用 Tensorflow 对象检测 API 定义自己的模型

python - 从另一个对象分配 __len__() 方法

python - 如何在不同版本的 python 上安装 python 模块

python - 从嵌套列表中删除特定的列和行

android - 如何使包含下划线的文本 URL 工作

c# - URLDecode 后 QueryString 格式错误

python - 我如何自动指定模拟的 Celery 函数

python - 求和和删除 Numpy 数组的重复元素