apache-spark - Spark 作业卡在方法收集上

当我运行 Spark 作业时，它似乎卡在收集上:

enter image description here

我使用命令启动 jar:

./spark-1.3.0-bin-hadoop2.4/bin/spark-submit \
  --class com.MyObject \
  --master spark://192.168.192.22:7077 \
  --executor-memory 512M \
  --driver-memory 512M \
  --deploy-mode cluster \
  --total-executor-cores 4 \
  /home/pi/spark-job-jars/spark-job-0.0.1-SNAPSHOT.jar

Jar source : 

package com

import org.apache.spark.SparkContext
import org.apache.spark.SparkConf

object MyObject {

  def main(args: Array[String]) {

    println("here")


    val sc = new SparkContext(new SparkConf())

    val l = (1 to 10).toList
    val s = sc.parallelize(l)
    val out = s.map(m => m * 3)
    out.collect.foreach(println)

  }

}

jar

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>
    <groupId>spark-job</groupId>
    <artifactId>spark-job</artifactId>
    <version>0.0.1-SNAPSHOT</version>
    <packaging>jar</packaging>

    <build>
        <sourceDirectory>src</sourceDirectory>
        <resources>
            <resource>
                <directory>src</directory>
                <excludes>
                    <exclude>**/*.java</exclude>
                </excludes>
            </resource>
        </resources>
        <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.1</version>
                <configuration>
                    <source>1.5</source>
                    <target>1.5</target>
                </configuration>
            </plugin>
        </plugins>
    </build>

    <dependencies>

        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-core_2.11</artifactId>
            <version>1.2.1</version>
            <scope>provided</scope>
        </dependency>

        <dependency>
            <groupId>org.apache.spark</groupId>
            <artifactId>spark-streaming_2.11</artifactId>
            <version>1.2.1</version>
            <scope>provided</scope>
        </dependency>
    </dependencies>

</project>

我可以看到作业正在运行但从未完成: enter image description here

我创建/部署 jar 的方式是否存在问题，导致它无法完成作业？

最佳答案

“或者，如果您的应用程序是从远离工作计算机的计算机提交的(例如，在您的笔记本电脑本地)，则通常使用集群模式来最大限度地减少驱动程序和执行程序之间的网络延迟。请注意，集群模式是目前不支持独立集群、Mesos 集群或 python 应用程序。”

摘自: https://spark.apache.org/docs/1.2.0/submitting-applications.html

关于apache-spark - Spark 作业卡在方法收集上，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29441084/

apache-spark - Spark 作业卡在方法收集上

上一篇：apache-camel - 当 activemq 不工作时，所有 Camel 路由都会停止

下一篇：powershell - 执行脚本时 TFS 生成定义部署后脚本错误