serialization - Spark Parallelize? (找不到名称为 'id'的创建者属性)

标签 serialization apache-spark

调用时导致Apache Spark 1.4.0中此序列化错误的原因是:

sc.parallelize(strList, 4)

抛出此异常:
com.fasterxml.jackson.databind.JsonMappingException: 
Could not find creator property with name 'id' (in class org.apache.spark.rdd.RDDOperationScope)

中的addBeanProps中抛出。Jackson :com.fasterxml.jackson.databind.deser.BeanDeserializerFactory#addBeanProps

RDD是Seq [String],#partitions似乎无关紧要(尝试1、2、4)。

没有序列化堆栈跟踪,因为正常情况下无法关闭工作进程闭包。

有什么其他方法可以追踪到这一点?

最佳答案

@Interfector是正确的。我也遇到了这个问题,这是我的sbt文件中的一个片段以及修复了它的'dependencyOverrides'部分。

libraryDependencies ++= Seq(
  "com.amazonaws" % "amazon-kinesis-client" % "1.4.0",
  "org.apache.spark" %% "spark-core" % "1.4.0",
  "org.apache.spark" %% "spark-streaming" % "1.4.0",
  "org.apache.spark" %% "spark-streaming-kinesis-asl" % "1.4.0",
  "com.amazonaws" % "aws-java-sdk" % "1.10.2"
)

dependencyOverrides ++= Set(
  "com.fasterxml.jackson.core" % "jackson-databind" % "2.4.4"
)

关于serialization - Spark Parallelize? (找不到名称为 'id'的创建者属性),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31039367/

相关文章:

apache-spark - 为什么最新的Hadoop没有内存计算功能?

java - JVM 是否会在分布式/并行处理中产生大量开销?

c# - 无法转换类型为 'System.Collections.Generic.List` 1 的对象

c# - ASP.NET *.resx 序列化

c# - 使用新标签和属性以及根自定义 XML 序列化

java - 如何在java中将*任何*对象类型缓存到内存/磁盘?

apache-spark - Spark 过滤器带有空格字符的奇怪行为 '\xa0'

javascript - 在javascript中获取2个字符之间的子字符串

java - 遇到无法在 pyspark 上运行程序的错误

apache-spark - 以编程方式访问实时 Spark 节点列表