当在EC2中运行Hadoop时,我似乎有两个选择:
- 答:使用 Hadoop 附带的 EC2 特定 shell 脚本自行管理集群。
- B:使用 Elastic MapReduce,并为方便起见支付一点额外费用。
我倾向于 B,但我希望有更多经验的人提供一些建议。这是我的问题:
- 是否有任何任务可以使用其中一种方法来完成,而另一种则不能?
- 除了这两个我忽略的选项之外,还有其他选项吗?
- 如果我选择 B,回到 A 有多容易?也就是说,供应商锁定有什么危险?
最佳答案
第三个选项: 您可以使用apache whirr在ec2上设置hadoop集群(也支持rackspace)
关于amazon-ec2 - EC2 上的 Hadoop 有什么建议吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4964885/