Google Cloud Preemptible 实例多久抢占一次(大致)?

标签 google-compute-engine

我看到 Google Cloud 可能 terminate preemptible instances at any time ,但是否有任何非官方的独立研究报告显示“抢占率”(每小时抢占的虚拟机数量),可能是在几个不同的地区进行抽样?

考虑到我发现的信息很少(与 similar questions 一样),即使是诸如“回顾过去 6 个月,我通常看到 uswest1 每小时有 3% - 5% 的实例抢占”这样的轶事也会很有用(我认为这可以像 AWS 中的实例计数指标一样进行监控)。

客户偶尔会为了“便宜”(尽管 best practices )而将他们现有的非容错代码推送到云中,并且在没有预期的故障率的情况下,他们常常被便宜所蒙蔽抢占式的,所以我想分享一些 GCP 社区的典型经验,即使人们的经验可能有所不同,以帮助传达安全期望。


想想“非官方的、独立的研究”和“甚至像这样的轶事:”“客户偶尔会为了“便宜”而将他们现有的、非容错的代码推送到云中”,应该说没有人头脑清醒的架构师或系统管理员会将具有已定义 SLA 的生产工作负载置于执行环境中 without SLA .因此,该主题颇具推测性。

对于那些热衷于此的人,Google 提供了 preemption rate expectation :

For reference, we've observed from historical data that the average preemption rate varies between 5% and 15% per day per project, on a seven-day average, occasionally spiking higher depending on time and zone. Keep in mind that this is an observation only: Preemptible instances have no guarantees or SLAs for preemption rates or preemption distributions.

除此之外还有一个有趣的 edutainment approach到“如何使不适用适用”的任务。

