amazon-web-services - 如何让 Zeppelin 在 EMR 集群上干净地重启？

标签 amazon-web-services hadoop pyspark amazon-emr apache-zeppelin

我正在运行 EMR 集群并尝试使用 Zeppelin 笔记本进行数据分析。

版本: 发布标签:emr-5.2.1
Hadoop 发行版:Amazon 2.7.3
hive 2.1.0
Spark 2.0.2
飞艇 0.6.2

我一直遇到 Zeppelin 在运行查询时挂起的问题，而且我永远无法恢复它。我试过:
- 重新启动解释器
- 通过 SSH 进入主节点并运行 zeppelin_daemon.sh restart(已尝试以 hadoop/root/zeppelin 身份运行，并使用选项 reload 运行脚本，开始/停止, upstart)

每次我使用守护程序 shell 脚本时，它都会告诉我它已经停止/启动正常，但是当我运行状态时我得到这个:
Zeppelin 正在运行但进程已死 [FAILED]

我似乎唯一能做的就是杀死我的集群并建立一个新集群，这在很多层面上都是疯狂的。

那么...官方支持的重启 Zeppelin 的方式是什么？？？

最佳答案

我通过 ssh 进入主节点，然后运行

$ sudo stop zeppelin
zeppelin stop/waiting

$ sudo start zeppelin
zeppelin start/running, process 24434

紧接着，刷新 Zeppelin 给了我一个 503，但大约 2 分钟后，UI 再次可用。我检查了/var/log/zeppelin 中的日志，配置设置需要一些时间。

关于amazon-web-services - 如何让 Zeppelin 在 EMR 集群上干净地重启？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42032490/

上一篇：hadoop - Ext JS 库未在 Oozie 中正确安装

下一篇：hadoop - Oozie 作业错误 - java.io.IOException : configuration is not specified

相关文章：

hadoop - 在 Hadoop Hive 中计数

amazon-web-services - 对 AWS Cloudformation 标签和逻辑 ID 有疑问吗？

amazon-web-services - 亚马逊 Redshift 中的并发查询性能

hadoop - 如何维护 Reducer 中 MapWritables 的顺序？

hadoop - 由于找不到方法错误，在 Hbase 中上传 HFiles 失败

apache-spark - Spark /Pyspark : SVM - How to get Area-under-curve?

python - 如何在 PySpark 中将行值(时间序列)转置为列值？

python - 将 pyspark 数据帧中的多列转换为一个字典

amazon-web-services - 在无服务器的AWS Lambda上运行dockerized函数

python - 发现 Boto 异常 NoAuthHandler