python-3.x - 对于 fast.com,Requests-html 包无法正确呈现

标签 python-3.x python-requests-html

我正在使用 python 3.7 开发一个网络抓取应用程序。我正在使用 requests-html 来解析数据。到目前为止,我已经尝试了以下代码,它尝试使用渲染功能(因为 fast.com 上的速度数据是通过 javascript 加载的)。

from requests_html import HTMLSession
quote_page = 'https://fast.com'
session = HTMLSession()
r = session.get(quote_page)
r.html.render()
extract_value = r.html.find('#speed-value', first=True)
print(extract_value.text)

speed-value是包含速度数据的div使用的id属性。

但它仍然将速度值打印为 0。

最佳答案

速度测试需要几秒钟,初始渲染后需要等待几秒钟,所以指定一个 sleep 参数来渲染函数,这意味着初始渲染后要休眠多长时间。

例如:修改r.html.render()r.html.render(sleep=10)

在我的电脑上测试,我得到了一个速度数。

关于python-3.x - 对于 fast.com,Requests-html 包无法正确呈现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54498046/

相关文章:

python - 随机数文件写入和读取

python - 类型错误:Python 中 + 不支持的操作数: 'dict' 和 'str'

python - 使用 'requests-html'时如何使用绝对链接路径获取原始html

当requests_html使用pyppeteer安装Chrome时,python3 SSL证书问题

python - 将另一个后缀添加到已经具有 pathlib 后缀的路径

Python unittest - 指定的文件仍必须作为模块导入?

python - 列出 QMainWindow 的所有快捷方式

javascript - 如何在滚动时从使用 javascript 加载元素的网页中进行抓取?

python - 使用 requests-html 解析元素的尾部