我目前正在阅读Hadoop in Action。这本书非常好,但是它使用hadoop 1.2.1来解释和展示所有示例。但是,我正在使用hadoop 2.2.0。
有人知道我在哪里可以找到有关hadoop api更改的完整文档吗?以及1.2.1和2.2.0之间的简单映射?
举些例子
DataJoinMapperBase, DataJoinReducerBase, and TaggedMapOutput
在2.2.0中不存在,我正在2.2.0中寻找对应的对象:)
谢谢
最佳答案
"Hadoop: The Definitive Guide, Third Edition" by Tom White (Buy Here)
支持hadoop v2.2。
源代码在github https://github.com/tomwhite/hadoop-book上给出
如在github上提到的,本书的代码经过测试
This version of the code has been tested with:
* Hadoop 1.2.1/0.22.0/0.23.x/2.2.0
* Avro 1.5.4
* Pig 0.9.1
* Hive 0.8.0
* HBase 0.90.4/0.94.15
* ZooKeeper 3.4.2
* Sqoop 1.4.0-incubating
* MRUnit 0.8.0-incubating
关于您的问题
Hadoop 2.2使用mapreduce api v2,而Hadoop 1.x使用旧的mapreduce api。检查这本书,可以清楚地说明1.x和2.2之间的mapreduce代码差异。
希望能帮助到你..!!!
关于hadoop - hadoop-1.2.1和hadoop-2.2.0之间的映射?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20684604/