amazon-ec2 - EC2 上的 Hadoop 有什么建议吗?

标签 amazon-ec2 hadoop mapreduce

当在EC2中运行Hadoop时,我似乎有两个选择:

  • 答:使用 Hadoop 附带的 EC2 特定 shell 脚本自行管理集群。
  • B:使用 Elastic MapReduce,并为方便起见支付一点额外费用。

我倾向于 B,但我希望有更多经验的人提供一些建议。这是我的问题:

  1. 是否有任何任务可以使用其中一种方法来完成,而另一种则不能?
  2. 除了这两个我忽略的选项之外,还有其他选项吗?
  3. 如果我选择 B,回到 A 有多容易?也就是说,供应商锁定有什么危险?

最佳答案

第三个选项: 您可以使用apache whirr在ec2上设置hadoop集群(也支持rackspace)

关于amazon-ec2 - EC2 上的 Hadoop 有什么建议吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4964885/

相关文章:

python - 简单的 Python TCP 服务器不适用于 Amazon EC2 实例

python - 从 EC2 实例访问 Amazon S3 Bucket

php - Codeigniter:无法找到模型

mapreduce - MapReduce 中如何进行混洗?

amazon-web-services - AWS 免费套餐使用即将到期

hadoop - 使用 Pig 加载默认转储文件

hadoop - Hive 合并小型 ORC 文件

hadoop - 如何追加到HDFS上创建的文件

hadoop - 在 Eclipse Map/Reduce 位置中,New Hadoop 位置没有响应?

java - 面临合并洗牌和排序 Mapreduce 的问题