amazon-web-services - RedShift 节点故障转移

标签 amazon-web-services amazon-redshift failovercluster

我有一个由 4 个节点组成的 RedShift 集群。

  • 当其中一个节点宕机时,整个集群会变得不可用吗?
  • 如果是 - 多长时间?
  • 当集群恢复时 - 它是否恢复到与故障前完全相同的点,或者数据可能从几个小时前回滚到 S3 快照?
  • 我如何模拟这种情况来自己检查这种情况?

  • 非常感谢!

    最佳答案

    如果是单节点故障 - 亚马逊将启动一个新节点并从其他节点流式传输数据(如果有的话,每个块都会写入两个不同的节点)。
    在这种情况下,我们可以预期:

  • 整个集群的停机时间,直到新节点启动 + 填充数据库信息。应该是大约3-4分钟。
  • 在这 3 到 4 分钟之后,该集群将返回到与它关闭之前完全相同的点。该集群可用于读取和写入。
  • 由于集群中的数据重新分布,将会出现一些减速。

  • 如果多个节点发生故障,redshift 将从最新的 S3 备份中恢复自身。
    S3 备份在以下情况下完成:
  • 如果距上次备份已过去 8 小时
  • 如果自上次备份以来 RedShift 填充了超过 5GB 的数据
  • 手动
  • 当您选择终止集群时,您可以选择最终快照
  • 关于amazon-web-services - RedShift 节点故障转移,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20539234/

    相关文章:

    java - 关于为基于 Servlet 的 Java Web 应用程序设置负载平衡和故障转移的书籍/资源

    python - 使用 AWS Lambda Function 将机器学习引入实时生产

    node.js - 无法连接到 Amazon EC2 上的 Node 服务器

    amazon-web-services - S3 Glacier 对象未还原

    amazon-web-services - Redshift卸载的文件名

    session - tomcat集群是 session 复制的唯一方式吗?

    sql-server - 故障转移群集上的 SQL Server 2008 Reporting Services

    python - 如何修复 AWS lambda 中的 "Unable to import module"错误

    apache-spark - 如何将表从 redshift 导出为 Parquet 格式?

    postgresql - 选择查询自定义计算列四舍五入到小数点后两位