amazon-ec2 - EC2 上的 Hadoop 有什么建议吗？

标签 amazon-ec2 hadoop mapreduce

当在EC2中运行Hadoop时，我似乎有两个选择:

答:使用 Hadoop 附带的 EC2 特定 shell 脚本自行管理集群。
B:使用 Elastic MapReduce，并为方便起见支付一点额外费用。

我倾向于 B，但我希望有更多经验的人提供一些建议。这是我的问题:

是否有任何任务可以使用其中一种方法来完成，而另一种则不能？
除了这两个我忽略的选项之外，还有其他选项吗？
如果我选择 B，回到 A 有多容易？也就是说，供应商锁定有什么危险？

最佳答案

第三个选项: 您可以使用apache whirr在ec2上设置hadoop集群(也支持rackspace)

关于amazon-ec2 - EC2 上的 Hadoop 有什么建议吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/4964885/

上一篇：python - 在 Hadoop MapReduce 脚本中导入外部库

下一篇：amazon-s3 - 将目录作为压缩文件从 Elastic MapReduce 上传到 S3

相关文章：

python - 简单的 Python TCP 服务器不适用于 Amazon EC2 实例

python - 从 EC2 实例访问 Amazon S3 Bucket

php - Codeigniter:无法找到模型

mapreduce - MapReduce 中如何进行混洗？

amazon-web-services - AWS 免费套餐使用即将到期

hadoop - 使用 Pig 加载默认转储文件

hadoop - Hive 合并小型 ORC 文件

hadoop - 如何追加到HDFS上创建的文件

hadoop - 在 Eclipse Map/Reduce 位置中，New Hadoop 位置没有响应？

java - 面临合并洗牌和排序 Mapreduce 的问题

©2024 IT工具网联系我们