对于我的硕士论文,我尝试在 4 个节点上设置一个 Flink 独立集群。我已经按照文档进行了工作,该文档非常清楚地解释了如何设置它。但是,当我启动集群时,会出现警告,当我尝试运行作业时,会出现错误并显示相同的消息:
akka.pattern.AskTimeoutException: Ask timed out on [Actor[akka.tcp://flink@MYHOSTNAME:6123/user/jobmanager#-818199108]] after [10000 ms]. Sender[null] sent message of type "org.apache.flink.runtime.messages.JobManagerMessages$LeaderSessionMessage"
增加超时不起作用。当我在 Web UI 中打开任务管理器时,它们都具有以下模式:
akka.tcp://flink@MYHOSTNAME:33779/user/taskmanager
有人知道如何解决这个问题以使集群正常工作吗?提前致谢!
最后一件事:集群上没有用户“flink”,因此不会被创建。因此,如果没有告诉我应该创建该用户,任何建议都将非常感激!谢谢!
最佳答案
不确定它是否仍然相关,但我是这样做的(使用 Flink 1.5.3):
我按照以下方式设置了一个具有 3 个主站 (JobManager) 和 20 个从站 (TaskManager) 的 HA 独立集群。
- 定义您的conf/masters 文件(主机名:每行8081)
- 定义您的conf/slaves 文件(每行每个任务管理器主机名)
- 在每台主机上的 flink-conf.yaml 中定义自己的 jobmanager.rpc.address 主机名
- 在每台从机上的 flink-conf.yaml 中将 jobmanager.rpc.address 定义为 localhost
- 设置完所有内容后,在任意主控主机上执行 bin/start-cluster.sh。
如果您需要HA,那么您需要设置zookeeper仲裁并修改有关HA的相应属性(high-availability、high-availability.storageDir、high-availability.zookeeper.quorum)
关于java - Apache 弗林克 : Standalone Cluster tries to connect with username "flink",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49069595/