ruby-on-rails - 无法运行程序 “-files”(在 “.”目录中):error = 2，没有这样的文件或目录

标签 ruby-on-rails ruby hadoop amazon-web-services emr

我正在尝试为使用hadoop的Amazon ElasticMapReduce服务使用aws sdk ruby运行步骤，虽然我可以创建集群和步骤，但是该步骤始终会失败，但是使用Web界面手动设置时不会失败

emr = Aws::EMR::Client.new
    cluster_id = "*******"
    resp = emr.add_job_flow_steps({
      job_flow_id: cluster_id, # required
      steps: [ # required
        {
          name: "TestStep", # required
          action_on_failure: "CANCEL_AND_WAIT", # accepts TERMINATE_JOB_FLOW, TERMINATE_CLUSTER, CANCEL_AND_WAIT, CONTINUE
          hadoop_jar_step: { # required
            jar: 'command-runner.jar',
            args:[
                "-files",
                "s3://source123/mapper.py,s3://source123/source_reducer.py",
                "-mapper",
                "mapper.py",
                "-reducer",
                "source_reducer.py",
                "-input",
                "s3://source123/input/",
                "-output",
                "s3://source123/output/"
            ]
          },
        },
      ],
    })

我得到的错误是这个
Cannot run program "-files" (in directory "."): error=2, No such file or directory
有什么线索吗？

最佳答案

似乎添加hadoop-streaming的工作方式如下

emr = Aws::EMR::Client.new
    cluster_id = "*******"
    resp = emr.add_job_flow_steps({
      job_flow_id: cluster_id, # required
      steps: [ # required
        {
          name: "TestStep", # required
          action_on_failure: "CANCEL_AND_WAIT", # accepts TERMINATE_JOB_FLOW, TERMINATE_CLUSTER, CANCEL_AND_WAIT, CONTINUE
          hadoop_jar_step: { # required
            jar: 'command-runner.jar',
            args:[
                "hadoop-streaming",
                "-files",
                "s3://source123/mapper.py,s3://source123/source_reducer.py",
                "-mapper",
                "mapper.py",
                "-reducer",
                "source_reducer.py",
                "-input",
                "s3://source123/input/",
                "-output",
                "s3://source123/output/"
            ]
          },
        },
      ],
    })

关于ruby-on-rails - 无法运行程序 “-files”(在 “.”目录中):error = 2，没有这样的文件或目录，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36899395/

上一篇：docker - 本地部署在 minikube 上

下一篇：scala - 无法在Spark中使用HDFS中的文件

hadoop - 我想创建仪表板以使用Hadoop处理数据

hadoop - Hive无法检测到当前的名称节点

java - Hadoop 0.21.0 中打开文件描述符的预期消耗

ruby-on-rails - 破折号:连接未关闭

ruby-on-rails - 在Omniauth和Ruby on Rails 3中使用YouTube登录

ruby-on-rails - rails 6 : How to disable Webpack and use Sprockets instead

ruby - 奇怪的行为: Hash's keys cancel dynamic method definition

arrays - 用另一个数组的元素替换数组中的 nils 的最佳方法

ruby - 我可以使用 FactoryGirl 创建无效值吗？