scala - 错误 SparkContext : Error initializing SparkContext

标签 scala apache-spark

我正在使用 spark-1.5.0-cdh5.6.0 .尝试了示例应用程序 (scala)
命令是:

> spark-submit --class com.cloudera.spark.simbox.sparksimbox.WordCount --master local /home/hadoop/work/testspark.jar

得到以下错误:
 ERROR SparkContext: Error initializing SparkContext.
java.io.FileNotFoundException: File file:/user/spark/applicationHistory does not exist
        at org.apache.hadoop.fs.RawLocalFileSystem.deprecatedGetFileStatus(RawLocalFileSystem.java:534)
        at org.apache.hadoop.fs.RawLocalFileSystem.getFileLinkStatusInternal(RawLocalFileSystem.java:747)
        at org.apache.hadoop.fs.RawLocalFileSystem.getFileStatus(RawLocalFileSystem.java:524)
        at org.apache.hadoop.fs.FilterFileSystem.getFileStatus(FilterFileSystem.java:424)
        at org.apache.spark.scheduler.EventLoggingListener.start(EventLoggingListener.scala:100)
        at org.apache.spark.SparkContext.<init>(SparkContext.scala:541)
        at com.cloudera.spark.simbox.sparksimbox.WordCount$.main(WordCount.scala:12)
        at com.cloudera.spark.simbox.sparksimbox.WordCount.main(WordCount.scala)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
        at java.lang.reflect.Method.invoke(Method.java:606)
        at org.apache.spark.deploy.SparkSubmit$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:672)
        at org.apache.spark.deploy.SparkSubmit$.doRunMain$1(SparkSubmit.scala:180)
        at org.apache.spark.deploy.SparkSubmit$.submit(SparkSubmit.scala:205)
        at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:120)
        at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

最佳答案

Spark有一个叫做“历史服务器”的功能,可以让你浏览SparkContext之后的历史事件。死了。此属性通过设置 spark.eventLog.enabled 设置至 true .

您有两个选择,或者通过 spark.eventLog.dir 指定一个有效的目录来存储事件日志。配置值,或者简单地设置 spark.eventLog.enabledfalse如果你不需要它。

您可以在 Spark Configuration 中阅读更多相关信息。页。

关于scala - 错误 SparkContext : Error initializing SparkContext,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36038188/

相关文章:

hadoop - 启动 Spark REPL 时出错

apache-spark - Spark Streaming:无状态重叠窗口与保持状态

Scala:反射和案例类

scala - 是否可以在不进入 spark-shell 的情况下运行 Spark Scala 脚本?

scala - 在案例类之间继承属性

Scala - 返回类型参数化对象的类型参数化特征方法 - 如何实现?

java - 获取 Spark 的流窗口时间戳

apache-spark - Spark : Determine the driver address from within a task

apache-spark - 如何调整 spark 执行程序数量、内核和执行程序内存?

postgresql - PredictionIO UniversalRecommender Elasticsearch 错误