amazon-web-services - 从 aws s3 存储桶下载 yfcc100m

标签 amazon-web-services amazon-s3 dataset s3cmd

我正在尝试下载 AWS 中托管的数据集。
我正在尝试使用 s3cmd并使用我的访问 key 和 secret key 对其进行配置。
我可以使用以下方法正确列出存储桶中的文件:

s3cmd ls s3://yahoo-webscope/I3set13/

我用过 get下载数据集:
s3cmd get --recursive s3://yahoo-webscope/I3set13/

但显示以下错误:
ERROR: S3 error: 403 (Forbidden)

我发现的一些解决方案建议更改存储桶策略,但我无法更改它,因为我不是所有者。

请让我知道问题背后的原因以及如何解决。

最佳答案

根据 https://multimediacommons.wordpress.com/yfcc100m-core-dataset/ ,尽管数据集托管在 S3 存储桶中,但对其的访问受到限制,因此您需要 submit a request并按照进一步的电子邮件说明进行访问:

Getting the YFCC100M: The dataset can be requested at Yahoo Webscope. You will need to create a Yahoo account if you do not have one already, and once logged in you will find it straightforward to submit the request for the YFCC100M. Webscope will ask you to tell them what your plans are with the dataset, which helps them justify the existence of their academic outreach program and allows them to keep offering datasets in the future. Unlike other datasets available at Webscope, the YFCC100M does not require you to be a student or faculty at an accredited university, so you will be automatically approved.

关于amazon-web-services - 从 aws s3 存储桶下载 yfcc100m,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41585056/

相关文章:

r - R : The subscript var has the wrong type quosure/formula. It must be numeric or character中的错误

delphi - ClientDataSet 上的 StatusFilter

sql - 如何在 Amazon Redshift 中创建索引

amazon-web-services - EC2 实例上的静态页面不在 CloudFormation 中的负载均衡器后面提供服务

c++ - AWS s3 cpp sdk读取的字节数超出指定范围

javascript - 上传到s3后无法查看PDF。上传图像工作正常(NodeJS)

amazon-web-services - aws cdk Fn.import_value 返回 token 忽略bucketname 的cloudformation 输出并显示 token

python - 将标签数据添加到卷积神经网络的更好方法?

bash - EC2 用户数据,启动时未执行的特定命令,手动工作正常

python - 如何使用 boto3 将自定义 EC2 指标发送到 CloudWatch 仪表板?