python - AWS Glue - 从 sql server 表读取并作为自定义 CSV 文件写入 S3

我从 1 月开始从事 Glue 工作，并使用 AWS Glue/Databricks/EMR 等工作过多个 POC、生产数据湖。我使用 AWS Glue 从 S3 读取数据并在加载到 Redshift、Aurora 之前执行 ETL，等等

我现在需要从 SQL SERVER 上的源表中读取数据，然后获取数据，将数据写入自定义(用户定义的)CSV 文件中的 S3 存储桶，比如 employee.csv。

我正在寻找一些指示，请这样做。

谢谢

最佳答案

您可以使用指定 connectionType=sqlserver 的 JDBC 进行连接，以获取连接到 SQL SERVER 的动态框架。在这里查看 GlueContext docs

dynF = glueContext.getSource(connection_type="sqlserver", url = ..., dbtable=..., user=..., password=)

关于python - AWS Glue - 从 sql server 表读取并作为自定义 CSV 文件写入 S3，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52336996/