hadoop - 什么是Hadoop集群?

标签 hadoop cluster-computing

我很困惑,因为我看到“集群”一词在多种情况下都被使用。以下哪项是对“群集”的正确使用?

  • 所有NameNode,作业跟踪器和数据节点
  • 一组NameNode,JobTracker和DataNodes(还有更多此类集合)

  • 编辑:
    这种令人困惑的行的示例是this page:DistCp (distributed copy) is a tool used for large inter/intra-cluster copying
    如果所有服务器(节点)在一起都是一个集群,那么“集群间复制”在哪里?如果服务器的子集是群集,那么该子集到底是什么?

    最佳答案

    Hadoop集群是主节点和从节点的组合,主节点是NameNode, Secondary NameNode and Job Tracker,从节点是DataNodes and TaskTrackers。在任何hadoop集群中,都有1个主节点实例,即1 NameNode, 1 Secondary NameNode and 1 Job Trackermultiple slave nodes (dataNodes and taskTrackers)

    关于hadoop - 什么是Hadoop集群?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21555084/

    相关文章:

    python - 使用 tf.io.gfile.makedirs 后程序中止

    tomcat - 如何在 Tomcat 集群中共享相同的 session ID

    java - Stacktrace 不在 Glassfish 4.1 集群日志中打印

    java - Apache Helix 资源平衡器(案例 : each resource on independent node)

    api - WSO2 API 管理器集群主动-主动节点

    hadoop - 如何将Cassandra转换为HDFS文件系统以进行Shark/Hive查询

    windows - 在Windows上解压缩.tar.gz文件

    hadoop - 如何增加 HBase 表中的区域数

    Hadoop客户端节点安装

    docker - Docker Swarm --advertise-addr更改