python - 如何访问 scrapy 上传到 S3 的图像名称?

标签 python amazon-s3 scrapy sha1

我知道 scrapy 使用 sha1 作为图像 URL 作为文件名。我想访问 scrapy 创建的同一个 sha1,我该怎么做?

最佳答案

您需要在项目中定义字段 image_urlsimages。然后不要忘记设置 IMAGES_STORE

图像管道将下载的文件元数据存储在 images 字段中。像这样:

{'image_urls': ['http://i.stack.imgur.com/tKsDb.png',
                'http://i.stack.imgur.com/NAGkl.png'],
 'images': [{'checksum': 'b0974ea6c88740bed353206b279e0827',
             'path': 'full/762f5682798c5854833316fa171c71166e284630.jpg',
             'url': 'http://i.stack.imgur.com/tKsDb.png'},
            {'checksum': '9a42f7bd1dc45840312fd49cd08e6a5c',
             'path': 'full/615eabb7b61e79b96ea1ddb34a2ef55c8e0f7ec3.jpg',
             'url': 'http://i.stack.imgur.com/NAGkl.png'}]}

关于python - 如何访问 scrapy 上传到 S3 的图像名称?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19075753/

相关文章:

c# - 从 HtmlAgilityPack 打印网页源代码

python - 如何在交互式控制台中使用 PyDev 用户命令

amazon-web-services - 戈朗 : GET request for presigned url of S3 object with SSE fails with 403 error

azure - 如何在 Azure 数据工厂中触发时检查某些文件是否正在上传(允许在 ADF 中上传时读取文件)

python - 如何使用Scrapy抓取有分页的网站?

python - 确定性问题 : set a buffer size in the CUBLAS_WORKSPACE_CONFIG environmental variable

amazon-web-services - 无法对齐导入的 S3 存储桶地形配置

python - 带有scrapy的 Selenium 用于动态页面

scrapy中Mysql语法错误

python - 如何从utcnow中提取日、月、年?