Kubernetes Cronjob 只运行一半时间

标签 kubernetes

我希望每 15 分钟触发一次作业,但它始终每 30 分钟触发一次。

更新:

我通过运行简化了问题:

kubectl run hello --schedule="*/1 * * * *" --restart=OnFailure --image=busybox -- /bin/sh -c "date; echo Hello from the Kubernetes cluster"

如此处文档中所述:https://kubernetes.io/docs/tasks/job/automated-tasks-with-cron-jobs/

但工作仍然拒绝按时运行。
$ kubectl get cronjobs
NAME               SCHEDULE      SUSPEND   ACTIVE    LAST SCHEDULE   AGE
hello              */1 * * * *   False     1         5m              30m
hello2             */1 * * * *   False     1         5m              12m

命令行创建的 cronjob 运行需要 25 分钟,从 yaml 创建的 cronjob 需要 7 分钟。他们最终被安排在同一时间,所以几乎就像 etcd 终于醒来并做了些什么一样?

原始问题:

当我深入到一个活跃的工作时,我看到 Status: Terminated: CompletedAge: 25 minutes或大于 15 的东西。

在日志中,我看到要运行的 python 脚本已经完成了它的最终打印语句。根据 s3 中的输出文件,该脚本需要大约 2 分钟才能完成。之后 28 分钟内不再安排新作业。

我尝试过不同的配置:
Schedule: */15 * * * *Schedule: 0,15,30,45 * * * *

Concurrency Policy: ForbidConcurrency Policy: Replace
这里还有什么问题?

已修改标识行的完整配置:
apiVersion: batch/v1beta1
kind: CronJob
metadata:
  labels:
    type: f-c
  name: f-c-p
  namespace: extract
spec:
  concurrencyPolicy: Forbid
  failedJobsHistoryLimit: 1
  jobTemplate:
    metadata:
      creationTimestamp: null
    spec:
      template:
        metadata:
          creationTimestamp: null
          labels:
            type: f-c
        spec:
          containers:
          - args:
            - /f_c.sh
            image: identifier.amazonaws.com/extract_transform:latest
            imagePullPolicy: Always
            env:
            - name: ENV
              value: prod
            - name: SLACK_TOKEN
              valueFrom:
                secretKeyRef:
                  key: slack_token
                  name: api-tokens
            - name: AWS_ACCESS_KEY_ID
              valueFrom:
                secretKeyRef:
                  key: aws_access_key_id
                  name: api-tokens
            - name: AWS_SECRET_ACCESS_KEY
              valueFrom:
                secretKeyRef:
                  key: aws_secret_access_key
                  name: api-tokens
            - name: F_ACCESS_TOKEN
              valueFrom:
                secretKeyRef:
                  key: f_access_token
                  name: api-tokens
            name: s-f-c
            resources: {}
            terminationMessagePath: /dev/termination-log
            terminationMessagePolicy: File
          dnsPolicy: ClusterFirst
          restartPolicy: Never
          schedulerName: default-scheduler
          securityContext: {}
          terminationGracePeriodSeconds: 30
  schedule: '*/15 * * * *'
  successfulJobsHistoryLimit: 1
  suspend: false
status: {}

最佳答案

在测试集群中运行这些作业后,我发现外部环境阻止了它们按预期运行。

在原始集群上有大约 20k 计划作业。 Kubernetes 的内置调度程序尚不能一致地处理此卷。

可以可靠运行的最大作业数(在预期时间的一分钟内)可能取决于主节点的大小。

关于Kubernetes Cronjob 只运行一半时间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50224404/

相关文章:

nginx - 使用 Nginx Ingress Controller 添加对 413 状态代码的自定义响应

apache-spark - Spark on K8 的问题加载 jar

docker - 如何在kubernetes中使用参数运行docker运行镜像

ssl - 通过 Nginx Ingress Controller 和证书管理器启用 SSL 后,TTFB 增加了 200 多毫秒

docker - 由于权限问题,Fluentd 无法访问/var/lib/docker/containers 下的日志

azure - 尝试使用 AKS 在 Azure 上创建托管 Kubernetes 集群时出现 "Incorrect padding"

ubuntu - 如何找到microk8s当前安装的 channel

docker - 跨GCP虚拟机共享数据的可能方式,这些虚拟机是docker swarm业务流程中的节点

docker - apache2:权限被拒绝:AH00072:make_sock:无法绑定(bind)到地址 0.0.0.0:80 没有可用的监听套接字,正在关闭

kubernetes - Openshift-重命名路线