我的问题有两个部分:
关于第 (1) 部分:如果我理解正确,所有实例修改都是在备用服务器上进行的,然后 AWS 通过在主服务器更新时将 CNAME 翻转到备用服务器来进行故障转移,所以如果我要创建任何类型的实例修改并选择“立即应用”,它应该会导致故障转移,对吗?
关于第 (2) 部分:我正在专门寻找一种监视 Oracle RDS 实例故障转移的方法,无论是通过 lambda 函数、bash 脚本还是其他方式。据我所知,即使我允许所有 ICMP 流量通过安全组,也不可能对 RDS 使用 ping。我可以使用 telnet 或 SQL 客户端毫无问题地进行连接。不过,我想要的是某种方式,例如在故障转移期间定期 ping 数据库以查看与连接字符串关联的 IP 何时切换以及需要多长时间。有什么建议?
最佳答案
The availability benefits of Multi-AZ deployments also extend to planned maintenance and backups. In the case of system upgrades like OS patching or DB Instance scaling, these operations are applied first on the standby, prior to the automatic failover. As a result, your availability impact is, again, only the time required for automatic failover to complete.
要模拟故障转移,只需 reboot with failover重新启动时,而不是重新启动两者。从链接的文档:
Reboot with failover is beneficial when you want to simulate a failure of a DB instance for testing, or restore operations to the original AZ after a failover occurs.
其他资源:
关于amazon-web-services - 多可用区 RDS 测试故障转移和连接监控,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42676212/