amazon-web-services - 从 Kafka 读取数据到 AWS Redshift 的最佳实践

标签 amazon-web-services apache-kafka aws-lambda amazon-redshift

将数据从 Kafka 集群移动到 Redshift 表的最佳实践是什么?
我们有连续数据到达 Kafka,我想将其写入 Redshift 中的表(不必实时)。

  • 我应该使用 Lambda 函数吗?
  • 我应该编写一个将在专用 EC2 实例上运行的 Redshift 连接器(消费者)吗? (缺点是我需要处理冗余)
  • 是否有一些 AWS 管道服务?
  • 最佳答案

    Kafka Connect 通常用于将数据从 Kafka 流式传输到(或从)数据存储。它可以做一些有用的事情,比如自动管理横向扩展、故障转移、模式、序列化等等。

    This blog展示了如何使用开源 JDBC Kafka Connect 连接器流式传输到 Redshift。还有一个community Redshift connector ,但我没有试过这个。

    This blog展示了另一种方法,不使用 Kafka Connect。

    免责声明:我为创建 JDBC 连接器的 Confluent 工作。

    关于amazon-web-services - 从 Kafka 读取数据到 AWS Redshift 的最佳实践,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51595109/

    相关文章:

    powershell - 无法使用 Cloudformation 安装 codedeploy-agent.msi

    mysql - 尝试通过 mysql CLI 连接到 mysql Aurora 时出现 SSL 连接错误

    email - 如何设置AWS域的电子邮件转发?

    scala - DataFrame 到 RDD[(String, String)] 的转换

    node.js - 通过 Node AWS SDK 的 lambda.invoke 调用在 5 分钟内超时,而 Lambda 在 4 分钟内完成

    ios - Amazon Web Services 运行时 fatal error "dyld: library not loaded"Swift 2.2

    java - 一个 Java Kafka Consumer 需要多少操作系统资源?

    apache-spark - 无法使用Spark读取kafka主题数据

    javascript - AWS Lambda 函数调用中的事件和上下文是什么?

    amazon-web-services - 通过 Cloudformation、CodeBuild 和 CodePipeline 将 python 包部署到 AWS Lambda