hadoop - hadoop-1.2.1和hadoop-2.2.0之间的映射?

标签 hadoop

我目前正在阅读Hadoop in Action。这本书非常好,但是它使用hadoop 1.2.1来解释和展示所有示例。但是,我正在使用hadoop 2.2.0。

有人知道我在哪里可以找到有关hadoop api更改的完整文档吗?以及1.2.1和2.2.0之间的简单映射?

举些例子

DataJoinMapperBase, DataJoinReducerBase, and TaggedMapOutput 

在2.2.0中不存在,我正在2.2.0中寻找对应的对象:)

谢谢

最佳答案

"Hadoop: The Definitive Guide, Third Edition" by Tom White (Buy Here)



支持hadoop v2.2。

源代码在github https://github.com/tomwhite/hadoop-book上给出

如在github上提到的,本书的代码经过测试
This version of the code has been tested with:
 * Hadoop 1.2.1/0.22.0/0.23.x/2.2.0
 * Avro 1.5.4
 * Pig 0.9.1
 * Hive 0.8.0
 * HBase 0.90.4/0.94.15
 * ZooKeeper 3.4.2
 * Sqoop 1.4.0-incubating
 * MRUnit 0.8.0-incubating

关于您的问题
Hadoop 2.2使用mapreduce api v2,而Hadoop 1.x使用旧的mapreduce api。检查这本书,可以清楚地说明1.x和2.2之间的mapreduce代码差异。

希望能帮助到你..!!!

关于hadoop - hadoop-1.2.1和hadoop-2.2.0之间的映射?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20684604/

相关文章:

hadoop - 大数据仓库和传统数据仓库有什么区别

maven - 是否可以在没有 Cygwin 的情况下在 Windows 上以本地模式运行 Hadoop 作业(如 WordCount 示例)?

hadoop - 运行 Map Reduce 作业显示错误 - Mkdirs 无法创建/var/folders/

hadoop - 使用 cloudera 管理器部署 hdfs core-site.xml

hadoop - 无法在端口 7180 上设置 cloudera manager web - 集群安装

azure - Azure HDInsights 中的 headnodehost

hadoop - 如何在MapReduce作业中导入存储在Hive中的表数据?

Hadoop dfs.include 文件

java - 扩展 SequenceFileInputFormat 以包含文件名+偏移量

hadoop - 配置单元中的 percentile_approx 返回零