我想知道是否可以下载公共(public) AWS 数据集的一部分以及如何下载。
具体来说,我想从 Common Crawl Corpus 下载一部分进行本地测试。
最佳答案
看来你可以。如果您将浏览器指向 public URL provided by Amazon ,您可以看到整个集合以及子集的链接。
您可以使用浏览器或任何 S3 客户端工具或库下载它。
关于amazon-web-services - 从亚马逊下载数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15051693/