amazon-web-services - 亚马逊消防站更新红移记录

标签 amazon-web-services amazon-kinesis-firehose

我们通过 API-Gateway > Kinesis Streams > Lambda > FireHose > Redshift Tables 使用我们所有的分析源。

AWS Lambda 是我们的转换足迹,接受 Kinesis 流根据上下文记录更改分析事件并将其放到 FireHouse 以将其保存到 Redshift DB。

在本次旅程中,我们希望在特定条件下更新 Redshift 记录(基本上是 UPSERT(插入 | 更新))。 firehose 中有什么东西可以避免红移中的重复记录吗?

最佳答案

开箱即用,没有。

如果您要更新插入的表是 T1,那么您可以做的是:

  • 让 Firehose 将记录转储到另一个表 T2。
  • 运行一个作业,使用 cron 或其他东西,定期从 T2 插入到 T1。使用事务,以避免在此查询和 Firehose 到 Redshift 查询同时运行时数据变坏。
  • 关于amazon-web-services - 亚马逊消防站更新红移记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40680347/

    相关文章:

    amazon-s3 - S3 - 匿名上传 - key 前缀

    json - 如何读取无效的 JSON 格式亚马逊 firehose

    aws-lambda - 将数据从 AWS lambda 推送到 Kinesis Firehose

    amazon-web-services - Aws KInesis Terraform - 如何将数据流连接到 Data Firehose

    amazon-web-services - Kinesis Firehose 上的慢 PutRecordBatch

    java - AWS Kafka (MSK) - 如何生成 keystore 和信任库并在我的 Spring Cloud Stream 应用程序中使用它们?

    java - SQSListener 与 ThreadpoolExecutor

    python - 在 Python 中执行 Postgresql 查询

    python - AWS Elastic Beanstalk 公开的源代码

    boto3 - 通过 Firehose 将 map 数据放入 Athena