python - python中请求之间的适当时间？

标签 python web-crawler python-requests google-crawlers

使用 python 请求模块(获取函数)我正在抓取链接，即爬虫。我使用该脚本发出多个请求。由于我提出了太多请求，谷歌通过验证码进行了干预，该验证码在一段时间后被重置。我使用时间模块在每次请求后使代码休眠一段时间以避免它。我想知道什么时候让脚本进入休眠状态，这样谷歌就不会将其视为无效流量？ (我使用的是大学代理服务器)

最佳答案

我发现这个网站对于正确的抓取非常有帮助:h

享受吧!

关于python - python中请求之间的适当时间？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42954422/

上一篇：amazon-web-services - 设置 AWS 进行数据处理 S3 或 EBS？

下一篇：c# - WebClient如何自动添加文件夹？

相关文章：

python - 类方法的同一性

python - 如何让按钮先停止播放音频文件，然后播放自己的音频？

python - 用 Beautiful soup 抓取内部链接

hadoop - 使用Nutch Content Limit的建议

python - (Python) 属性错误 : 'NoneType' object has no attribute 'text'

python - 如何使用Python子进程捕获子进程的错误？

python - 如何进行十六进制增量？

r - 映射博客之间的链接连接的最佳方式是什么？

python 异步请求

python-requests - wrap_socket() 得到一个意外的关键字参数 '_context' 和 deserialize(error)