hadoop - 集群中的Hortonworks沙箱

标签 hadoop bigdata

我是Hadoop生态系统的新手,我试图了解集群的工作原理。到目前为止,我一直在使用Hortonworks distribution在单节点模式下测试任何东西。现在我想知道-是否可以连接两个VM(物理上在一台PC上运行),以便一个将是NameNode,另一个将是DataNode(我不确定是否应该将它们分开)。我为Cloudera找到了类似的教程,因此我认为从理论上讲这是可能的。

如果在一台PC上运行两个Hadoop VM甚至不是一个好主意,那么,在两台独立PC上配置和运行它的最轻松的方法是什么?

最佳答案

可能会有用。这篇文章“设置Hadoop集群”
http://gbif.blogspot.ru/2011/01/setting-up-hadoop-cluster-part-1-manual.html

关于hadoop - 集群中的Hortonworks沙箱,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28717154/

相关文章:

hadoop - 如何从 Hadoop 的 Pig 处理的文件中修剪标题行?

ubuntu - InvalidProtocolBufferException:在Impala上连接到Hadoop 2.x.x

sql - hive 日期转换问题

hadoop - 使用Hadoop Map reduce处理和拆分大数据?

hadoop - 数值数据 - 高容量 + 高速度 + 快速检索

bigdata - Bigtable 性能影响列族

java - 当使用 HBase 作为 MapReduce 的源时,我可以扩展 TableInputFormatBase 来为每个区域创建多个拆分和多个映射器吗?

hadoop - Hive-在regexp_replace中用$替换时出错

hadoop - 在 Hive 中将 YYYY-MM-DD 日期转换为 YYYY-DD-MM

Hadoop HDFS 数据文件 : Displaying Datanodes & Blocks