hadoop - 集群中的Hortonworks沙箱

标签 hadoop bigdata

我是Hadoop生态系统的新手，我试图了解集群的工作原理。到目前为止，我一直在使用Hortonworks distribution在单节点模式下测试任何东西。现在我想知道-是否可以连接两个VM(物理上在一台PC上运行)，以便一个将是NameNode，另一个将是DataNode(我不确定是否应该将它们分开)。我为Cloudera找到了类似的教程，因此我认为从理论上讲这是可能的。

如果在一台PC上运行两个Hadoop VM甚至不是一个好主意，那么，在两台独立PC上配置和运行它的最轻松的方法是什么？

最佳答案

可能会有用。这篇文章“设置Hadoop集群”
http://gbif.blogspot.ru/2011/01/setting-up-hadoop-cluster-part-1-manual.html

关于hadoop - 集群中的Hortonworks沙箱，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28717154/

上一篇：hadoop - Hbase或HDFS会更好

下一篇：java - 线程 “main”中的ExException java.lang.IllegalArgumentException:/home不能是目录

相关文章：

hadoop - 如何从 Hadoop 的 Pig 处理的文件中修剪标题行？

ubuntu - InvalidProtocolBufferException:在Impala上连接到Hadoop 2.x.x

sql - hive 日期转换问题

hadoop - 使用Hadoop Map reduce处理和拆分大数据？

hadoop - 数值数据 - 高容量 + 高速度 + 快速检索

bigdata - Bigtable 性能影响列族

java - 当使用 HBase 作为 MapReduce 的源时，我可以扩展 TableInputFormatBase 来为每个区域创建多个拆分和多个映射器吗？

hadoop - Hive-在regexp_replace中用$替换时出错

hadoop - 在 Hive 中将 YYYY-MM-DD 日期转换为 YYYY-DD-MM

Hadoop HDFS 数据文件 : Displaying Datanodes & Blocks