python - 在Python中将S3数据并行/异步下载到EC2中?

标签 python amazon-s3 amazon-ec2

我在 S3 中存储了需要分析的大型数据文件。每批处理由约 50 个文件组成,每个文件都可以独立分析。

我想设置将 S3 数据并行下载到 EC2 实例中,并设置触发器来启动对每个下载文件的分析过程。

是否有任何库可以处理异步下载,在完整模型上触发?

如果没有,我正在考虑使用 pyprocessing 设置多个下载进程,每个进程都会下载并分析单个文件。这听起来合理还是有更好的选择?

最佳答案

为了回答我自己的问题,我最终对 Amazon S3 python 库进行了简单的修改,让您可以分块下载文件或逐行读取文件。 Available here .

关于python - 在Python中将S3数据并行/异步下载到EC2中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/538875/

相关文章:

amazon-web-services - AWS CLI 创建文件夹并上传文件

linux - Amazon ec2 centos 6 Spot 实例根卷

python - 调整 matplotlib basemap 颜色条中的数字精度

python - 如何根据 Numpy 数组的内容替换其特定条目

django - amazon s3 和 django - 仅允许来 self 的网站的用户,不允许匿名用户

r - 为Amazon深度学习AMI安装mxnet GPU R软件包的问题

java - 运行您自己的 GAE 服务器

python - 多个并发 fsm Fysom

Python Tkinter 在由 <function main_thread at ...> 启动的线程中出现未处理的异常

java - S3 SDK 能否自行确定存储桶的区域?