目前,我正在使用 Eclipse 开发我的 Hadoop 演示。我已经使用 Hadoop 独立模式运行并测试了它。
但现在我想将我的 Hadoop 演示编译成 Jar 文件,以像 Wordcount 示例一样以完全分布式模式部署它。
谁能指导我怎么做?
最佳答案
右键点击Project Explorer上的任何文件-> Export -> Generate Runnable jar file
选择main方法的类(以前是Driver类)。
将jar文件复制到集群的master节点。
然后,到master节点上安装hadoop的路径运行
bin/hadoop jar jarfile.jar /hdfs/input/path /hdfs/output/path
有关更多选项和详细信息,请阅读 this tutorial (对于新的 API/YARN)。
你必须先更新一些配置文件,比如/etc/hosts
,在集群节点之间设置一个无密码的ssh,并更新一些$HADOOP_HOME/conf/...
文件(至少在旧 API 中)。
关于hadoop - 分布式部署Hadoop程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31476249/