java - 如何配置连接到 AWS EMR spark 集群的 Java 客户端

标签 java amazon-web-services apache-spark emr

我正在尝试编写一个简单的 spark 应用程序,当我在本地运行它时,它可以将 master 设置为

.master("local[2]")

但是在 AWS (EMR) 上配置 spark 集群后,我无法连接到主 url:

.master("spark://<master url>:7077")

是这样吗?我在这里错过了什么吗? 集群已启动并正在运行,当我尝试将我的应用程序添加为步骤 jar 时,它将直接在它工作的集群中运行。但我希望能够从远程机器上运行它。

在此希望得到一些帮助, 谢谢

最佳答案

要从远程计算机运行,您需要在分配给您的 EMR 主节点的安全组中打开适当的端口。您至少需要添加 7077。

如果您所说的“远程”指的是不在您的 AWS 环境中的一个,您还需要设置一种方法来将流量从外部路由到它。

关于java - 如何配置连接到 AWS EMR spark 集群的 Java 客户端,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40405282/

相关文章:

java - 为什么 JLabel 不显示下划线字符?

amazon-web-services - 如何强制不删除流

mysql - 在 Amazon RDS 上启用 MySQL 通用日志

hive - Spark SQL HiveContext-saveAsTable创建错误的架构

apache-spark - Spark 2.x 中结构化流连接两个流的解决方法

Java 类路径问题 - 无法运行

java - 通过elasticsearch和spring进行联合搜索

java - CompositeCacheManager.getUnconfiguredInstance() API 使用

email - Reply-To Amazon SES 字段被自动回复器忽略

apache-spark - 从 Spark 执行器查询 cassandra