hadoop - 分布式部署Hadoop程序

标签 hadoop

目前,我正在使用 Eclipse 开发我的 Hadoop 演示。我已经使用 Hadoop 独立模式运行并测试了它。

但现在我想将我的 Hadoop 演示编译成 Jar 文件,以像 Wordcount 示例一样以完全分布式模式部署它。

谁能指导我怎么做?

最佳答案

右键点击Project Explorer上的任何文件-> Export -> Generate Runnable jar file

选择main方法的类(以前是Driver类)。

将jar文件复制到集群的master节点。

然后,到master节点上安装hadoop的路径运行

bin/hadoop jar jarfile.jar /hdfs/input/path /hdfs/output/path

有关更多选项和详细信息,请阅读 this tutorial (对于新的 API/YARN)。

你必须先更新一些配置文件,比如/etc/hosts,在集群节点之间设置一个无密码的ssh,并更新一些$HADOOP_HOME/conf/... 文件(至少在旧 API 中)。

关于hadoop - 分布式部署Hadoop程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31476249/

相关文章:

java - Hadoop 映射器直接写入输出。 (Reducer 写入映射器输出)

hadoop - Hive:更简洁的 SELECT AS 和 GROUP BY 方式

hadoop - 读取驱动程序 Hadoop 中的文件

hadoop - Spark 存在时 Hadoop 和流解决方案的相关性

hadoop - 配置查询更多

hadoop - Hive进程内存大小

hadoop dfs -ls 提示

hadoop - HIVE的自定义记录分隔符

mysql - sqoop merge-key 创建多个部分文件而不是一个不符合使用 merge-key 目的的文件

hadoop - Ganglia 监控 Hadoop 多节点集群