javascript - Python - 使用请求模块重建 Javascript 生成的代码

标签 javascript python browser beautifulsoup python-requests

我遇到了一个新问题。 我正在为网站编写一个抓取工具,通常对于此类任务我使用 selenium,但在这种情况下我不能使用任何模拟网络浏览器的东西。

在 StackOverflow 上进行研究时,我发现最好的解决方案是了解 javascript 的作用并通过 HTTP 重建请求。 是的,理论上我很了解,但不知道如何开始,因为我不太了解所涉及的技术。

在我的具体情况下,单击按钮时一些 HTML 会添加到页面中。使用开发人员工具,我在“单击”事件上设置了断点,但从这里开始,我真的迷失了。

任何人都可以链接一些我可以学习的资源和示例吗?

最佳答案

在大多数情况下,分析开发人员工具的“网络”选项卡并查看当您点击提到的按钮时触发的请求就足够了。

当您了解这些请求时,您将能够实现抓取工具来运行类似的请求并获取相关数据。

关于javascript - Python - 使用请求模块重建 Javascript 生成的代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32680534/

相关文章:

javascript - 如何使用 jQuery 从 span 标记的先前隐藏输入中获取值

javascript - 如何正确使用createSpyObj

python - 延迟操纵杆 IF 语句

python - 使用 Python 控制现有应用程序

javascript:如何调试键盘事件

javascript - 在函数外的 Javascript 脚本中使用 "return"关键字

javascript - 嵌套激活中的 "..."实际上是如何工作的? (验证)

javascript - 将 javascript 对象转换为 HTML

python - 将键,值动态添加到python中的字典

javascript - nodejs `arguments` 是对象,但在浏览器中,它是一个 `array`