hadoop - 什么是Hadoop集群？

我很困惑，因为我看到“集群”一词在多种情况下都被使用。以下哪项是对“群集”的正确使用？

所有NameNode，作业跟踪器和数据节点

一组NameNode，JobTracker和DataNodes(还有更多此类集合)

编辑:
这种令人困惑的行的示例是this page:DistCp (distributed copy) is a tool used for large inter/intra-cluster copying
如果所有服务器(节点)在一起都是一个集群，那么“集群间复制”在哪里？如果服务器的子集是群集，那么该子集到底是什么？

最佳答案

Hadoop集群是主节点和从节点的组合，主节点是NameNode, Secondary NameNode and Job Tracker，从节点是DataNodes and TaskTrackers。在任何hadoop集群中，都有1个主节点实例，即1 NameNode, 1 Secondary NameNode and 1 Job Tracker和multiple slave nodes (dataNodes and taskTrackers)

关于hadoop - 什么是Hadoop集群？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/21555084/

上一篇：hadoop - 初次调用reducer时

下一篇：java - 数十亿个类别的Bloom过滤器实现

相关文章：

python - 使用 tf.io.gfile.makedirs 后程序中止

tomcat - 如何在 Tomcat 集群中共享相同的 session ID

java - Stacktrace 不在 Glassfish 4.1 集群日志中打印

java - Apache Helix 资源平衡器(案例 : each resource on independent node)

api - WSO2 API 管理器集群主动-主动节点

hadoop - 如何将Cassandra转换为HDFS文件系统以进行Shark/Hive查询

windows - 在Windows上解压缩.tar.gz文件

hadoop - 如何增加 HBase 表中的区域数

Hadoop客户端节点安装

docker - Docker Swarm --advertise-addr更改