azure - 启用虚拟节点和未启用虚拟节点的 AKS 群集

标签 azure kubernetes azure-aks kubeflow

我想将 Kubeflow 安装到 Azure 中,因此我开始使用单节点(B4MS 虚拟机)创建 Azure Kubernetes 集群 (AKS)。在安装过程中,我没有启用虚拟节点池选项。创建 AKS 集群后,我运行命令“$ kubectl描述节点 aks-agentpool-3376354-00000”来检查规范。可分配的 Pod 数量为 110,我能够毫无问题地安装 Kubeflow。然而,后来我想要一个启用了虚拟节点池的 AKS 集群,这样我就可以使用 GPU 进行训练。因此,我删除了旧集群,并使用相同的 B4MS 虚拟机创建了一个新的 AKS 集群,并启用了虚拟节点池选项。这次,当我运行与上面相同的命令来描述节点规范时,可分配的 Pod 数量为 30,并且由于缺少要配置的 Pod,kubeflow 安装失败。

有人可以解释一下,为什么当启用或禁用虚拟节点选项时,可分配 Pod 的数量会发生变化?在启用虚拟节点池选项的情况下,如何将可分配 Pod 的数量保持为 110? 预先感谢您!

最佳答案

虚拟节点池需要使用 AKS 的高级网络配置,该配置引入了 AZURE CNI 网络插件。

使用 AZURE CNI 时,AKS 上每个节点的默认 POD 计数为 30 个 pod。

https://learn.microsoft.com/en-us/azure/aks/configure-azure-cni#maximum-pods-per-node

这就是您现在每个节点获得 30 个 MAX Pod 的主要原因。

使用 AZ CLI 预配集群时,可以将其更新为更大的数字。

https://learn.microsoft.com/en-us/cli/azure/ext/aks-preview/aks?view=azure-cli-latest#ext-aks-preview-az-aks-create

--max-pods -m
The maximum number of pods deployable to a node.

关于azure - 启用虚拟节点和未启用虚拟节点的 AKS 群集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61615566/

相关文章:

dns - 对kube-dns pod进行故障排除:WAITING初始化的超时

json - Loganalytics 工作区 ID 参数模板

azure - 无法在 windows10 上使用 PS7 安装 Az powershell 模块

Azure 服务总线 http 与 websocket

kubernetes - 基于路径的路由问题 Traefik 作为入口 Controller

azure - 如何为Azure Keyvault + SecretProviderClass + imagePullSecrets + 私有(private)docker存储库配置部署文件

azure-aks - AKS Horizo​​ntal Pod Autoscaling - 缺少 cpu 请求

azure - 与ntp时钟同步

c# - 按值从 Azure 队列服务中删除消息

每个应用程序的 Kubernetes 集群?