parallel-processing - 弗林克 : how does the parallelism set in the Jobmanager UI relate to task slots?

标签 parallel-processing bigdata apache-flink distributed-computing

假设我有 8 个任务管理器和 16 个任务槽。如果我使用 Jobmanager UI 提交作业并将并行度设置为 8,我是否只使用 8 个任务槽?

如果我有 8 个具有 8 个槽的任务管理器,并以 8 的并行度提交相同的作业怎么办?是一回事吗?还是数据处理方式不同?

谢谢。

最佳答案

Flink 集群中任务槽的总数定义了最大并行度,但使用的槽数可能会超过实际的并行度。例如,考虑这个工作:

Flink job

如果在具有 2 个任务管理器的集群中以两个并行运行,每个任务管理器提供 3 个槽,调度程序将使用 5 个任务槽,如下所示:

Parallelism of two with two task managers with three slots each

但是,如果基本并行度增加到 6,那么调度程序将执行此操作(请注意,在此示例中,接收器保持并行度为 1):

Increase parallelism to six

参见 Flink's Distributed Runtime Environment获取更多信息。

关于parallel-processing - 弗林克 : how does the parallelism set in the Jobmanager UI relate to task slots?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53480332/

相关文章:

c++ - 多线程算法工作得更慢

hadoop - 无法从 Windows 连接到 HBase

apache-flink - 能否在Flink中将and count和process time Trigger结合起来?

apache-flink - Flink Streaming : From one window, 在另一个窗口中查找状态

r - 在 R 中,有没有办法在同一台机器上的 R 的不同进程之间共享一个变量?

f# - 如何在 F# 3.0 中使用 pseq?

python - 使用 python3.7 进行慢速列表解析以删除重复项

mapreduce - GraphDB 查询和分片

hadoop - Flink 在 HDFS 上写入产生空文件

python - dask 包不使用所有内核?备择方案?