python - 如何使用 Python 下载有效的 Youtube 视频 HTML 页面?

标签 python html http web-scraping youtube

使用 requests.get(URL, allow_redirects=True)对于 Youtube、Reddit 或其他现代网页,提供了一堆未执行的 JavaScript,而不是我在使用浏览器打开页面时看到的实际 HTML 文本内容。
我只需要获取视频的标题。我怎样才能以一种轻松的方式做到这一点,而无需启动像 selenium 或 puppeteer 之类的重物,也无需使用 Youtube API?

最佳答案

我能够在所有 Javascript 和 HTML 中找到视频标题。

>>> import re
>>> r = requests.get("https://www.youtube.com/watch?v=UjLnvXpkq68", allow_redirects=True)
>>> m = re.search(r'"title":"(.*?)"', r.text)
>>> m.group(1)
'DJ OKAWARI「Perfect Blue」'
可能不是最漂亮的解决方案,但使用正则表达式可以避免解析整个文档。

关于python - 如何使用 Python 下载有效的 Youtube 视频 HTML 页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64718181/

相关文章:

python - 计算多项式的质数结果

python - 在计划任务的请求上下文之外更改 Flask-Babel 语言环境

python - 在grinder中跨代理、跨进程共享资源

javascript - 我怎样才能让滚动按钮与特定的视频网址相关联?

jquery - 向左展开箭头元素

http - 登录为电子邮件时 https 的 URI 方案

python - 由于串口打开情况,无法从 Arduino 和无线调制解调器读取串行数据

jquery - 网页的 Apple 触摸事件

注入(inject) URL 的 Javascript

java - Android Retrofit 从服务器下载/读取文本文件