python - 如何访问 scrapy 上传到 S3 的图像名称？

我知道 scrapy 使用 sha1 作为图像 URL 作为文件名。我想访问 scrapy 创建的同一个 sha1，我该怎么做？

最佳答案

您需要在项目中定义字段 image_urls 和 images。然后不要忘记设置 IMAGES_STORE。

图像管道将下载的文件元数据存储在 images 字段中。像这样:

{'image_urls': ['http://i.stack.imgur.com/tKsDb.png',
                'http://i.stack.imgur.com/NAGkl.png'],
 'images': [{'checksum': 'b0974ea6c88740bed353206b279e0827',
             'path': 'full/762f5682798c5854833316fa171c71166e284630.jpg',
             'url': 'http://i.stack.imgur.com/tKsDb.png'},
            {'checksum': '9a42f7bd1dc45840312fd49cd08e6a5c',
             'path': 'full/615eabb7b61e79b96ea1ddb34a2ef55c8e0f7ec3.jpg',
             'url': 'http://i.stack.imgur.com/NAGkl.png'}]}

关于python - 如何访问 scrapy 上传到 S3 的图像名称？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19075753/

上一篇：php - 如何在我的 PHP-Apache-PostgreSQL 站点中嵌入 python 脚本？

下一篇：python - 可以跨 Python 子进程共享资源(日志记录、数据库、文件等)吗？

相关文章：

c# - 从 HtmlAgilityPack 打印网页源代码

python - 如何在交互式控制台中使用 PyDev 用户命令

amazon-web-services - 戈朗 : GET request for presigned url of S3 object with SSE fails with 403 error

azure - 如何在 Azure 数据工厂中触发时检查某些文件是否正在上传(允许在 ADF 中上传时读取文件)

python - 如何使用Scrapy抓取有分页的网站？

python - 确定性问题 : set a buffer size in the CUBLAS_WORKSPACE_CONFIG environmental variable

amazon-web-services - 无法对齐导入的 S3 存储桶地形配置

python - 带有scrapy的 Selenium 用于动态页面

scrapy中Mysql语法错误

python - 如何从utcnow中提取日、月、年？