amazon-web-services - 如何让 Zeppelin 在 EMR 集群上干净地重启?

标签 amazon-web-services hadoop pyspark amazon-emr apache-zeppelin

我正在运行 EMR 集群并尝试使用 Zeppelin 笔记本进行数据分析。

版本: 发布标签:emr-5.2.1
Hadoop 发行版:Amazon 2.7.3
hive 2.1.0
Spark 2.0.2
飞艇 0.6.2

我一直遇到 Zeppelin 在运行查询时挂起的问题,而且我永远无法恢复它。我试过:
- 重新启动解释器
- 通过 SSH 进入主节点并运行 zeppelin_daemon.sh restart(已尝试以 hadoop/root/zeppelin 身份运行,并使用选项 reload 运行脚本,开始/停止, upstart)

每次我使用守护程序 shell 脚本时,它都会告诉我它已经停止/启动正常,但是当我运行状态时我得到这个:
Zeppelin 正在运行但进程已死 [FAILED]

我似乎唯一能做的就是杀死我的集群并建立一个新集群,这在很多层面上都是疯狂的。

那么...官方支持的重启 Zeppelin 的方式是什么???

最佳答案

我通过 ssh 进入主节点,然后运行 ​​

$ sudo stop zeppelin
zeppelin stop/waiting

$ sudo start zeppelin
zeppelin start/running, process 24434

紧接着,刷新 Zeppelin 给了我一个 503,但大约 2 分钟后,UI 再次可用。我检查了/var/log/zeppelin 中的日志,配置设置需要一些时间。

关于amazon-web-services - 如何让 Zeppelin 在 EMR 集群上干净地重启?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42032490/

相关文章:

hadoop - 在 Hadoop Hive 中计数

amazon-web-services - 对 AWS Cloudformation 标签和逻辑 ID 有疑问吗?

amazon-web-services - 亚马逊 Redshift 中的并发查询性能

hadoop - 如何维护 Reducer 中 MapWritables 的顺序?

hadoop - 由于找不到方法错误,在 Hbase 中上传 HFiles 失败

apache-spark - Spark /Pyspark : SVM - How to get Area-under-curve?

python - 如何在 PySpark 中将行值(时间序列)转置为列值?

python - 将 pyspark 数据帧中的多列转换为一个字典

amazon-web-services - 在无服务器的AWS Lambda上运行dockerized函数

python - 发现 Boto 异常 NoAuthHandler