amazon-web-services - EMR 主节点是否知道其集群 ID?

标签 amazon-web-services hadoop amazon-emr

我希望能够创建 EMR 集群,并让这些集群将消息发送回某个中央队列。为了让它工作,我需要在每个主节点上运行某种代理。这些代理中的每一个都必须在此消息中标识自己,以便收件人知道该消息是关于哪个集群的。

主节点是否知道它的 ID (j-***************)?如果不是,那么是否有其他一些识别信息可以让消息收件人推断出此 ID?

我查看了 /home/hadoop/conf 中的配置文件,但没有发现任何有用的东西。我在 /mnt/var/log/instance-controller/instance-controller.log 中找到了 ID,但看起来很难用 grep 查找。我想知道实例 Controller 最初可能从哪里获得该 ID。

最佳答案

您可以在主节点上查看 /mnt/var/lib/info/ 以找到有关 EMR 集群设置的大量信息。更具体地说,/mnt/var/lib/info/job-flow.json 包含 jobFlowId 或 ClusterID。

您可以使用预装的 json 解析器 (jq) 来获取作业流 ID。

cat /mnt/var/lib/info/job-flow.json | jq -r ".jobFlowId"

(根据@Marboni 更新)

关于amazon-web-services - EMR 主节点是否知道其集群 ID?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20227091/

相关文章:

postgresql - 将数据从 PostgreSQL 移动到 AWS S3 并使用 RedShift Spectrum 进行分析

amazon-web-services - Cloudfront 到 s3 重定向到子域给出访问被拒绝错误

hadoop - 如何加速 Pig MultiStorage

apache-spark - 使用 Apache Spark 将数据持久化到 DynamoDB

hadoop - 使用EMR中的Spark无法从S3读取Avro

ruby-on-rails - 从 s3 存储桶删除对象 Rails 5 aws-sdk

typescript - 由于未在堆栈级别指定帐户/区域,因此无法从上下文提供程序 ami 检索值

java - Java程序: unmappable character for encoding UTF8的编译错误

hadoop - 以独立模式运行 HBase 但收到 hadoop "retrying connect to server"消息?

amazon-web-services - AWS EMR 使用 KMS 加密 S3 存储桶