mysql - AWS Data Pipeline 将 CSV 从 S3 复制到 RDS MySQL

标签 mysql csv amazon-s3 amazon-rds amazon-data-pipeline

我的 S3 存储桶中有一个目录,其中包含许多格式相同的 .CSV 文件(名字、姓氏、位置、日期)。

我一直在尝试使用 Data Pipeline 将这些 CSV 文件的内容填充到 RDS MySQL 数据库表中。幸运的是,亚马逊已经为此操作提供了一个模板。

“将 S3 数据加载到 RDS MySQL 表中” http://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-template-copys3tords.html

我已经填写了它要求的所有适当信息。

当我激活管道时,它会创建 CopyActivity 和 ShellCommandActivity。复制事件复制数据,如果 Shell 命令事件认为该表不存在,则创建该表。 Shell 命令事件成功连接到我的 RDS。

但是,我的问题是 ShellCommandActivity 在没有实际创建表的情况下切换到“FINISHED”状态,然后 CopyActivity 卡在“WAITING_ON_DEPENDENCIES”。整个过程大约需要 20 分钟。

我的所有角色都可以完全访问所有服务。

如果大家有什么见解,欢迎评论。我已经在这个问题上停留了将近 2 周了。

最佳答案

我会尝试使用从要创建的表中选择所有数据的 SQLActivity,这个新的 SQLActivity 将是 CopyActivity 的依赖项。

关于mysql - AWS Data Pipeline 将 CSV 从 S3 复制到 RDS MySQL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36553233/

相关文章:

java - jpa hibernate,是否可以在不指定查询的情况下列出表的所有行?

php - 如何解决MySQL权限问题

python - 如何向数据行添加标题属性?

ruby-on-rails - stub AWS S3 对象请求

mysql - 在 select 语句中设置默认值(不使用 UNION 语句)

mysql - 设置成员(member)搜索说明

php - 尝试根据名称将 CSV 加载到 MySql 表中

shell - 我可以使用 grep 提取 CSV 文件的单列吗?

javascript - Blur.JS 不适用于 Amazon S3 图像

apache-spark - 对于相同的配置,Spark s3a会引发403错误