python - Scrapy Shell - 如何更改 USER_AGENT

标签 python shell scrapy agent

我有一个功能齐全的 scrapy 脚本来从网站提取数据。在安装过程中,目标站点根据我的 USER_AGENT 信息禁止了我。我随后添加了一个 RotateUserAgentMiddleware 来随机旋转 USER_AGENT。这很好用。

但是,现在当我尝试使用 scrapy shell 测试 xpath 和 css 请求时,出现 403 错误。我确定这是因为 scrapy shell 的 USER_AGENT 默认为目标站点已列入黑名单的某个值。

问题:是否可以使用不同于默认值的 USER_AGENT 在 scrapy shell 中获取 URL?

fetch(' http://www.test ') [加点东西??更改 USER_AGENT]

谢谢

最佳答案

scrapy shell -s USER_AGENT='自定义用户代理' 'http://www.example.com'

关于python - Scrapy Shell - 如何更改 USER_AGENT,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25429671/

相关文章:

python - 如何将 numpy 字符串数组(带逗号)保存到 CSV?

python - 如何使用非大写 p 的 TensorFlow tf.print?

linux - 字符替换的shell命令

shell - 不阻塞地读取可选标准输入

python - 如何在scrapy框架python中的start_urls列表中构造url

python - scrapy 导入错误 : scrapy. core.downloader.handlers.s3.S3DownloadHandler

python - 提取Tensorflow对象检测API的图像对象

python - Pandas 对现有索引进行重采样

bash - 使用 shell 脚本将零填充为二进制数

python - Scrapy - 发送新请求/使用回调