我有一个正在运行网站的 dcos 集群。该网站在 20 个 docker 实例上运行。当我查看我的应用程序时,我发现我有 24 个实例。其中 2 个实例的状态为已启动,但运行状况未知,另外 2 个实例的状态为已暂存。来自先前部署的旧实例 我尝试了以下操作:
- 销毁应用程序(结果:销毁/azure-tracking-api 时出错:Futures 在 [10000 毫秒] 后超时)
- 杀死所有实例(结果:它们全部重新启动)
在日志中我没有看到任何重大错误,除了
无法终止 [email protected] 框架 517c75b9-0a13-4b3b-a29d-8d754239991b-0000(马拉松)的任务 azure-tracking-api.908a6c3e-8948-11e6-be5a-7e591cfeda59 :42546 因为未知;执行对账
我使用的版本是0.28.1
我的问题是我可以用几个命令来解决这个问题。我知道如何解决此问题的唯一方法是设置一个新集群。
最佳答案
您正在使用的 Marathon 版本 (1.1.2) 已被识别 issues与丢失的任务。一旦 DC/OS 1.8 在 Azure 上可用,最好的选择就是升级。作为解决方法,目前您可以使用 Marathon 的 HTTP API 手动删除任务。 :
$ curl -X DELETE $MARATHON_URL/v2/apps/azure-tracking-api/tasks/$TASKID?force=true
关于Mesos 马拉松不能毁掉工作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39835130/