hadoop - 如何在 aws emr 中将 ec2-user 添加到 hadoop

标签 hadoop amazon-web-services aws-sdk emr amazon-emr

我是 aws emr 的新手，想添加新用户并在 hadoop 中创建一些目录。

所以我正在为创建目录做些什么。

登录hadoop机器

ssh hadoop@(publicIP)
hadoop fs -mkdir /user
hadoop fs -mkdir /user/tomcat/
hadoop fs -chmod 777 /
hadoop fs -chmod 777 /tomcat

我想使用 aws-cli 或将此方法添加到 EMR-bootstrap 来执行此过程。

最佳答案

您可以在 shell 脚本中编写创建目录的命令，并将该脚本添加为一个步骤。您可以在启动集群时执行此操作:

aws emr create-cluster --name "Test cluster" --ami-version 3.10 --applications Name=Hue Name=Hive Name=Pig \
--use-default-roles --ec2-attributes KeyName=myKey \
--instance-type m3.xlarge --instance-count 3 \
--steps Type=CUSTOM_JAR,Name=CustomJAR,ActionOnFailure=CONTINUE,Jar=s3://elasticmapreduce/libs/script-runner/script-runner.jar,Args=["s3://mybucket/script-path/my_script.sh"]

或在启动集群后将其添加为作业流程中的第一步:

aws emr add-steps --cluster-id <<$clusterId>> --steps Type=CUSTOM_JAR,Name=CustomJAR,ActionOnFailure=CONTINUE,Jar=s3://elasticmapreduce/libs/script-runner/script-runner.jar,Args=["s3://mybucket/script-path/my_script.sh"

关于hadoop - 如何在 aws emr 中将 ec2-user 添加到 hadoop，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35290948/

上一篇：hadoop - Hbase rowkey 用于跟踪实体的状态并避免全表扫描

下一篇：apache - 解决mapreduce.Cluster Failed to use org.apache.hadoop.mapred.YarnClientProtocolProvider due to error in instantiating YarnClient

相关文章：

hadoop - 保留更改后如何重新分配数据 block

node.js - 如何在node js中发送响应后调用函数

python - 使用 Python 在 AWS Lambda 中进行反向搜索

hadoop - 无法在 hadoop 中格式化 Namenode

php - 生成人口热图 : Mapreduce?

Hadoop级联: CascadeException "no loops allowed in cascade" when cogroup pipes twice

amazon-web-services - 跨多个环境共享 SQS

amazon-web-services - 当我尝试在我的新 Amazon Linux 实例中执行任何操作时，为什么我的 AWS CLI 挂起？

git - 在无法访问原始版本的情况下迁移 git 存储库服务器时出现问题

node.js - Bitbucket 管道，在 NodeJS 脚本中使用 ENV VARS 部署到 S3 Deploy