java + Spark : org. apache.spark.SparkException : Job aborted: Task not serializable: java. io.NotSerializableException

标签 java serialization apache-spark

我是 spark 的新手,正在尝试运行示例 JavaSparkPi.java,它运行良好,但是因为我必须在另一个 java 中使用它,所以我将所有内容从 main 复制到类中的一个方法并尝试调用main中的方法,它说

org.apache.spark.SparkException: Job aborted: Task not serializable: java.io.NotSerializableException

代码如下所示:

public class JavaSparkPi {

public void cal(){
    JavaSparkContext jsc = new JavaSparkContext("local", "JavaLogQuery");
    int slices = 2;
    int n = 100000 * slices;

    List<Integer> l = new ArrayList<Integer>(n);
    for (int i = 0; i < n; i++) {
        l.add(i);
    }

    JavaRDD<Integer> dataSet = jsc.parallelize(l, slices);

    System.out.println("count is: "+ dataSet.count());
    dataSet.foreach(new VoidFunction<Integer>(){
        public void call(Integer i){
            System.out.println(i);
        }
    });

    int count = dataSet.map(new Function<Integer, Integer>() {
        @Override
        public Integer call(Integer integer) throws Exception {
            double x = Math.random() * 2 - 1;
            double y = Math.random() * 2 - 1;
            return (x * x + y * y < 1) ? 1 : 0;
        }
    }).reduce(new Function2<Integer, Integer, Integer>() {
        @Override
        public Integer call(Integer integer, Integer integer2) throws Exception {
            return integer + integer2;
        }
    });

    System.out.println("Pi is roughly " + 4.0 * count / n);
}

public static void main(String[] args) throws Exception {

    JavaSparkPi myClass = new JavaSparkPi();
    myClass.cal();
}
}

有人知道吗?谢谢!

最佳答案

嵌套函数持有对包含对象 (JavaSparkPi) 的引用。所以这个对象将被序列化。为此,它需要可序列化。简单易行:

public class JavaSparkPi implements Serializable {
  ...

关于java + Spark : org. apache.spark.SparkException : Job aborted: Task not serializable: java. io.NotSerializableException,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24046744/

相关文章:

amazon-web-services - Spark 写入/读取 S3 - 分区大小和压缩

java - 布局在 Windows 7 中被破坏,但在 Windows XP 中看起来不错

java - SQL Server raiserror 指令不会在 java 代码中引发异常

java - Android SQLite 查询

c# - 在 C# 中序列化和反序列化 Oracle.DataAccess.OracleException

c# - .NET 中的方法是否也与数据成员一起序列化?

ruby-on-rails - 数组的未定义方法 `serializable_hash'

scala - 运行 Scala MongoDB 连接器时出现 java.lang.ClassNotFoundException : org. apache.spark.sql.DataFrame 错误

java - 将 ArrayList 折叠为单个整数

dictionary - Spark mapPartitions 与 transient 惰性 val