Python - 请求拉取 HTML 而不是 JSON

标签 python json python-3.x python-requests

我正在构建一个 Python 网络抓取工具(个人使用),但在检索 JSON 文件时遇到了一些麻烦。我能够找到所需的请求 URL,但当我运行脚本(我使用请求)时,URL 返回 HTML,而不是 Chrome 开发人员工具控制台中显示的 JSON。这是我当前的脚本:

import requests
import json

url = 'https://nytimes.wd5.myworkdayjobs.com/Video?clientRequestID=1f1a6071627946499b4b09fd0f668ef0'

r = requests.get(url)
print(r.text)

对 Python 来说是全新的,因此任何朝着正确方向的插入都将受到高度赞赏。谢谢!

最佳答案

看起来该网站根据请求提供的接受 header 返回响应。所以尝试一下:

import requests
import json

url = 'https://nytimes.wd5.myworkdayjobs.com/Video?clientRequestID=1f1a6071627946499b4b09fd0f668ef0'

r = requests.get(url, headers={'accept': 'application/json'})
print(r.json())

您可以查看完整的 api 以供进一步引用:http://docs.python-requests.org/en/latest/api/ .

关于Python - 请求拉取 HTML 而不是 JSON,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48631253/

相关文章:

json - 带 jq 的日期/数字过滤器

python - Cherrypy REST> 类型错误 : Chunk is not of type bytes

python-3.x - 通过对 Python 3.6 Flask 应用程序中的路由的 HTTP 请求启动非阻塞异步函数调用

python - 为什么人脸聚类算法不使用距离矩阵而不是聚类算法?

python - 使用 Python 将字符串替换为 dict 中的值

python - 注销页面在 Django 中不起作用

php json_encode 为数组返回空白

python - 使用 d3.js 、 pandas 和 flask 的条形图

css - Django-Tables2 CSS 不工作

python - 使用不同的 Python 工具连接 C/C++