amazon-web-services - 从 Kafka 读取数据到 AWS Redshift 的最佳实践

标签 amazon-web-services apache-kafka aws-lambda amazon-redshift

将数据从 Kafka 集群移动到 Redshift 表的最佳实践是什么？
我们有连续数据到达 Kafka，我想将其写入 Redshift 中的表(不必实时)。

我应该使用 Lambda 函数吗？

我应该编写一个将在专用 EC2 实例上运行的 Redshift 连接器(消费者)吗？ (缺点是我需要处理冗余)

是否有一些 AWS 管道服务？

最佳答案

Kafka Connect 通常用于将数据从 Kafka 流式传输到(或从)数据存储。它可以做一些有用的事情，比如自动管理横向扩展、故障转移、模式、序列化等等。

This blog展示了如何使用开源 JDBC Kafka Connect 连接器流式传输到 Redshift。还有一个community Redshift connector ，但我没有试过这个。

This blog展示了另一种方法，不使用 Kafka Connect。

免责声明:我为创建 JDBC 连接器的 Confluent 工作。

关于amazon-web-services - 从 Kafka 读取数据到 AWS Redshift 的最佳实践，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51595109/

上一篇：python-3.x - 在 Pandas 列上应用 MinMaxScaler()

下一篇：bitcoin - Coinbase API v2 获取多天的历史价格

mysql - 尝试通过 mysql CLI 连接到 mysql Aurora 时出现 SSL 连接错误

email - 如何设置AWS域的电子邮件转发？

scala - DataFrame 到 RDD[(String, String)] 的转换

node.js - 通过 Node AWS SDK 的 lambda.invoke 调用在 5 分钟内超时，而 Lambda 在 4 分钟内完成

ios - Amazon Web Services 运行时 fatal error "dyld: library not loaded"Swift 2.2

java - 一个 Java Kafka Consumer 需要多少操作系统资源？

apache-spark - 无法使用Spark读取kafka主题数据

javascript - AWS Lambda 函数调用中的事件和上下文是什么？

amazon-web-services - 通过 Cloudformation、CodeBuild 和 CodePipeline 将 python 包部署到 AWS Lambda