我有一个启用了自动缩放的 AKS 集群,其中规则基于平均 CPU。
默认节点数为 := default = 5
、min = 4
和 max = 7
并且缩放规则有冷却时间5 分钟。
而平均 CPU 使用率对于 4 个节点来说足够低。
我发现更令人惊讶的是,事件日志仅突出显示小规模事件!它们的冷却时间一致为5分钟,所以AKS认为他一直在缩小规模,神奇地出现新节点,并且不断缩小规模?
谁能解释一下这是怎么回事以及造成这种情况的原因是什么?
最佳答案
• 由于您已将节点池中的默认节点数设置为 5,但 CPU 平均利用率也没有达到 40%,因此它会自动将其缩减到配置的节点池中的最低节点数,即,4 个节点,一旦达到该节点数,就满足自动缩小条件,并再次扩大到默认节点数 5。这解释了发布的第一张图片中节点的不断扩大和缩小.
• 根据以下 Microsoft 文档,事件日志中以默认 5 分钟持续时间捕获的连续缩减事件是默认延迟 5 分钟的扩展事件的冷却时间。并且仅捕获缩小事件,因为在节点池中缩小到 4 个节点至默认节点数 5 后,CPU 初始化和利用率仅根据水平自动缩放器规则触发缩小事件。因此,事件日志中仅记录缩减事件:-
https://learn.microsoft.com/en-us/azure/aks/concepts-scale#cooldown-of-scaling-events
此外,请查找以下 Kubernetes 文档以供引用:-
关于Azure AKS 节点池不根据缩放配置文件自动缩放,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70666951/