Hadoop+Spark - 一旦应用程序正常启动一次就会显示错误

标签 hadoop apache-spark connection hadoop-yarn distributed-computing

我有一个包含 40 000 行的文件,每行一个单词,彼此。

我启动 Hadoop、主服务器、从服务器 - 一切正常:

start-dfs.sh;start-yarn.sh;/opt/spark/sbin/start-master.sh;/opt/spark/sbin/start-slaves.sh

我运行示例应用程序,计算单词数:

/opt/spark/bin/spark-submit --class org.apache.spark.examples.JavaWordCount --deploy-mode cluster --master yarn --driver-memory 2g --executor-memory 2g /opt/spark/examples/jars/spark-examples_2.11-2.0.0.jar hdfs://hadoop-master:9000/input/outputData.fcs

我遇到了问题:一旦应用程序将正常启动并显示结果,一旦将显示错误(并且我不会在重新启动之间进行任何更改):

ERROR shuffle.RetryingBlockFetcher: Exception while beginning fetch of 1 outstanding blocks 
java.io.IOException: Failed to connect to iws2/172.29.77.40:43688

Link to full log with error

我不知道哪里出了问题。在我的配置文件下面:

yarn-site.xml

所有从机和主机都在“master”、“slaves”文件中正确设置。

最佳答案

错误状态:

Failed to connect to iws2/172.29.77.40:43688

结果是网络问题。确保您的集群配置正确并开始查找相关信息。

希望这对您有所帮助。

关于Hadoop+Spark - 一旦应用程序正常启动一次就会显示错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39046063/

相关文章:

python连接mySql错误-ConnectionRefusedError : [WinError 10061]

java - 如何在Hadoop 2.6中访问JobCounters和FileSystemCounters?

scala - HDFS : java. io.FileNotFoundException : File does not exist: name. _COPYING

scala - 如何在Oozie spark scala作业中将文件从本地复制到HDFS目录?

python - 通过另一个 mysql 连接通过 "select"命令更新该数据后,无法通过 "update"sql 命令获取最新的数据库数据

c++ - 如何扫描无线网络并显示所有连接的计算机和设备的列表

hadoop - 如何让 Spark 忽略丢失的输入文件?

azure - C#Map Reduce失败,出现 “{”响应状态代码并不表示成功:403(禁止)。“}有时是401:需要凭据

python - 统一码编码错误 : 'ascii' codec can't encode character error

apache-spark - 如何判断我正在Spark中运行哪个应用程序?