我最近阅读和听到了一些有关云计算和map-reduce技术的内容。我正在考虑尝试一些算法,以获得该领域的实践经验,并看看现在有什么可能。
这是我想做的: 我想使用一些带有内置 MapReduce 功能的公共(public)云平台(例如 Google App Engine、Google MapReduce、Amazon ECS、Amazon MapReduce),或者如果它没有内置支持,请使用额外的 MapReduce Java 库(例如 Hadoop、Hive),并实现/部署一些算法。
有人在该领域取得过一些经验并指出了一个好的起点吗?或者说出一些在实践中效果良好的组合?
提前致谢!
最佳答案
Amazon EC2 有一些预捆绑的 Hadoop AMI。请参阅Running Hadoop on Amazon EC2获取教程。
特别是Cloudera我想到了发行版 - 它也附带 Pig 和 Hive。
关于java - 哪个 Map-Reduce 库和/或平台与 java 一起使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2207529/