python - spark python API java_gateway套接字连接错误

标签 python sockets apache-spark mesos

我的集群是Spark-0.7.2 + Mesos-0.9。我用python编写了一个spark程序,它在本地模式下运行良好。但是当我在mesos上运行它时发生了一些错误。这是错误信息:

13/09/30 15:40:13 INFO TaskSetManager: Finished TID 13 in 242 ms (progress: 2/3)
13/09/30 15:40:13 INFO DAGScheduler: Completed ResultTask(4, 1)
send
Exception in thread "DAGScheduler" spark.SparkException: EOF reached before Python server acknowledged
        at spark.api.python.PythonAccumulatorParam.addInPlace(PythonRDD.scala:303)
        at spark.api.python.PythonAccumulatorParam.addInPlace(PythonRDD.scala:278)
        at spark.Accumulable.$plus$plus$eq(Accumulators.scala:52)
        at spark.Accumulators$$anonfun$add$2.apply(Accumulators.scala:235)
        at spark.Accumulators$$anonfun$add$2.apply(Accumulators.scala:233)
        at scala.collection.mutable.HashMap$$anonfun$foreach$1.apply(HashMap.scala:93)
        at scala.collection.mutable.HashMap$$anonfun$foreach$1.apply(HashMap.scala:93)
        at scala.collection.Iterator$class.foreach(Iterator.scala:660)
        at scala.collection.mutable.HashTable$$anon$1.foreach(HashTable.scala:157)
        at scala.collection.mutable.HashTable$class.foreachEntry(HashTable.scala:190)
        at scala.collection.mutable.HashMap.foreachEntry(HashMap.scala:43)
        at scala.collection.mutable.HashMap.foreach(HashMap.scala:93)
        at spark.Accumulators$.add(Accumulators.scala:233)
        at spark.scheduler.DAGScheduler.handleTaskCompletion(DAGScheduler.scala:494)
        at spark.scheduler.DAGScheduler.processEvent(DAGScheduler.scala:300)
        at spark.scheduler.DAGScheduler.spark$scheduler$DAGScheduler$$run(DAGScheduler.scala:364)
        at spark.scheduler.DAGScheduler$$anon$1.run(DAGScheduler.scala:107)
13/09/30 15:40:13 INFO TaskSetManager: Finished TID 12 in 407 ms (progress: 3/3)

这并非每次都发生。似乎套接字连接不是固定的。有人可以建议如何解决此问题吗?

最佳答案

我通过将Java 8更新为U91解决了这个问题

关于python - spark python API java_gateway套接字连接错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19089687/

相关文章:

python - 接触函数的数值分析-表示形状的最有效,最简单的方法

C# 套接字 : Client Mishandle 'a' as the Client's id

python - 不接受条件语句的简单 Python Socket 服务器

amazon-web-services - 在AWS Glue pyspark中设置 Spark 配置

scala - 填充 Spark 数据框列中的缺失日期

python - 创建多帧 .tif 文件

python - 使用 matplotlib/python 设置绘图轴限制时出现问题

python - 有没有办法在不关闭窗口的情况下更新 matplotlib 图?

android - 在 Android 中发布和获取的 HttpsURL 连接

java - 线程 "main"java.lang.NoClassDefFoundError : when launching pyspark 中的异常