azure - 启用虚拟节点和未启用虚拟节点的 AKS 群集

标签 azure kubernetes azure-aks kubeflow

我想将 Kubeflow 安装到 Azure 中,因此我开始使用单节点(B4MS 虚拟机)创建 Azure Kubernetes 集群 (AKS)。在安装过程中,我没有启用虚拟节点池选项。创建 AKS 集群后,我运行命令“$ kubectl描述节点 aks-agentpool-3376354-00000”来检查规范。可分配的 Pod 数量为 110,我能够毫无问题地安装 Kubeflow。然而,后来我想要一个启用了虚拟节点池的 AKS 集群,这样我就可以使用 GPU 进行训练。因此,我删除了旧集群,并使用相同的 B4MS 虚拟机创建了一个新的 AKS 集群,并启用了虚拟节点池选项。这次,当我运行与上面相同的命令来描述节点规范时,可分配的 Pod 数量为 30,并且由于缺少要配置的 Pod,kubeflow 安装失败。

有人可以解释一下,为什么当启用或禁用虚拟节点选项时,可分配 Pod 的数量会发生变化?在启用虚拟节点池选项的情况下,如何将可分配 Pod 的数量保持为 110? 预先感谢您!

最佳答案

虚拟节点池需要使用 AKS 的高级网络配置,该配置引入了 AZURE CNI 网络插件。

使用 AZURE CNI 时,AKS 上每个节点的默认 POD 计数为 30 个 pod。

https://learn.microsoft.com/en-us/azure/aks/configure-azure-cni#maximum-pods-per-node

这就是您现在每个节点获得 30 个 MAX Pod 的主要原因。

使用 AZ CLI 预配集群时,可以将其更新为更大的数字。

https://learn.microsoft.com/en-us/cli/azure/ext/aks-preview/aks?view=azure-cli-latest#ext-aks-preview-az-aks-create

--max-pods -m
The maximum number of pods deployable to a node.

关于azure - 启用虚拟节点和未启用虚拟节点的 AKS 群集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61615566/

相关文章:

logging - 根据在 Google Cloud 上的 Kubernetes 中运行的容器日志创建 Prometheus 指标

docker - 重启Kubernetes集群中Linux节点的最佳策略

azure - 在 ACI 或 AKS 上部署的 AMLS 模型的 1 分钟服务超时

azure - 您好,我可以在 AKS 节点组中执行自定义脚本吗?

java - 如何以编程方式加密 Azure VM 数据磁盘

windows - 在 Azure Blob 存储中存储我的角色服务包有多安全?

c# - ServiceBusSender 在一天后停止工作

当azure服务总线中有消息时,Azure触发的webjob不会触发

amazon-web-services - AWS 上的 Kubernetes 自动缩放节点

azure - Azure Kubernetes 服务的沙盒(gVisor 或 Kata 容器)以运行不受信任的代码