python - 在 AWS EMR 上运行 python 脚本

标签 python amazon-web-services jar emr

我正在尝试在 EMR 集群上运行 python 和 java 应用程序。我使用下面的代码运行我的 java jar 应用程序,它运行良好。 HadoopJarStepConfig runExampleConfig = new HadoopJarStepConfig() .withJar(jar_name) .withArgs(main_arguments);

如何运行 python 脚本而不是 java 应用程序?

最佳答案

您是否尝试过阅读有关 script-runner jar 的内容?在电子病历上?您可以使用如下所示的方法来提交 python 脚本作为 EMR 步骤 -

HadoopJarStepConfig runExampleConfig = new HadoopJarStepConfig() 
.withJar(s3://<region>.elasticmapreduce/libs/script-runner/script-runner.jar)
.withArgs(s3://bucketname/path-to/script.sh);

根据您启动 EMR 集群的区域,需要将其中替换为适当的值(例如:us-east-1)。

关于python - 在 AWS EMR 上运行 python 脚本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49881550/

相关文章:

python - 如何将 Pandas 数据框转换为 XML?

Python 从文本文件中切片和分割数据

Python:根据类的无效 RGBA 参数 0.0 色点

Java 不支持主要次要版本 52?尽管我没有使用 Oracle Java 1.8 的新功能,为什么会发生这种情况?

具有相邻继承的python嵌套类?

node.js - 具有多个条件的AWS DYNAMODB查询

ruby - 错误 : undefined method "each" for String when running elastic-mapreduce specifying distributed cache file

amazon-web-services - 到外部 REST API 的 AWS API 网关

java - Java音板-声音不可移植

java - IDE 内部的 Jython 正常,IDE 外部, "no os specific module found"?