我遇到了一个新问题。 我正在为网站编写一个抓取工具,通常对于此类任务我使用 selenium,但在这种情况下我不能使用任何模拟网络浏览器的东西。
在 StackOverflow 上进行研究时,我发现最好的解决方案是了解 javascript 的作用并通过 HTTP 重建请求。 是的,理论上我很了解,但不知道如何开始,因为我不太了解所涉及的技术。
在我的具体情况下,单击按钮时一些 HTML 会添加到页面中。使用开发人员工具,我在“单击”事件上设置了断点,但从这里开始,我真的迷失了。
任何人都可以链接一些我可以学习的资源和示例吗?
最佳答案
在大多数情况下,分析开发人员工具的“网络”选项卡并查看当您点击提到的按钮时触发的请求就足够了。
当您了解这些请求时,您将能够实现抓取工具来运行类似的请求并获取相关数据。
关于javascript - Python - 使用请求模块重建 Javascript 生成的代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32680534/