apache-spark - Apache Spark:MesosClusterDispatcher可以在Docker容器中运行执行程序吗?

标签 apache-spark docker cluster-computing mesos

我正在构建一个Mesos集群以运行Apache Spark。我希望对我的Spark执行器使用Docker容器,我可以使用spark-submit的客户端模式(使用--master mesos://mesosmaster:5050--conf spark.mesos.executor.docker.image=myimage:latest)来做到这一点,但是我希望能够在集群模式下做到这一点。

我正在运行MesosClusterDispatcher并向其提交作业(使用--master mesos://clusterdispatcher:7077 --mode cluster --supervised),但是当我指定docker镜像供执行者使用时,似乎调度程序正在忽略该参数,并尝试直接在Mesos沙箱中运行作业。

实际上可以将集群调度程序与spark.mesos.executor.docker.image结合使用吗?我希望尽可能地将Spark与Mesos分离,以便它们可以独立升级,但是很显然,如果集群调度程序不能使用docker镜像,我将不得不重新考虑我的策略。

谢谢!

最佳答案

看一下这个
https://github.com/wangqiang8511/docker-spark-mesos

尽管我在较大的集群上部署时遇到了问题,但它似乎应该可以工作。

关于apache-spark - Apache Spark:MesosClusterDispatcher可以在Docker容器中运行执行程序吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45887240/

相关文章:

apache-spark - 使用Kotlin和Apache Spark 2.3的Fat JAR

android - 删除旧 map 标记并在集群管理器中加载新 map 标记

r - 如何修复在 ShinyProxy 中获取 CSS 和 Javascript 文件时出现的 '404 (Not Found)' 错误

python - 在二维可视化簇时,轴上的数字意味着什么?

networking - 限制 Condor 作业的调度 : one per physical machine

apache-spark - Spark : How to overwrite a file on S3 folder and not complete folder

python - 使用 PySpark 将 JSON 文件读取为 Pyspark Dataframe?

scala - 如何在 Spark 中转置 RDD

Docker 构建挂起。我怎样才能看到发生了什么?

mysql - 无法在docker中使用mysql连接到数据库sonarqube