hadoop - zookeeper和kafka在hadoop 2.6集群中放在哪里

Hadoop 2.6 使用 Yarn 作为下一代 map reduce，也是集群管理器。我们还需要使用 zookeeper 和 hadoop 2.6 来管理集群服务吗？我们如何设置动物园管理员。

如何为 hadoop 集群安装 Kafka 连接。 kafka 将数据发送到 hadoop 文件系统的消费者和生产者是什么。

它们都适合什么地方。

我已经设置了一个 hadoop 2.6 单节点集群。接下来，我的理解是让 zookeeper 和 Kafka 将数据流式传输到 hadoop 文件系统。而且我不知道如何将 kafka 用于 hadoop 或其 api。

最佳答案

Zookeeper 是分布式系统的协调框架。 Zookeeper 用于协调 HDFS 和 Yarn 高可用性中的状态，Hbase 主服务器和区域服务器之间的协调等。 Kafka 与 Apache Storm、Apache HBase 和 Apache Spark 结合使用，用于流数据的实时分析和渲染。常见用例包括:

流处理。
网站事件跟踪
指标收集和监控
日志聚合

通常我们将 Kafka 与 Storm 一起使用。 Storm 需要一个 zookeeper 集群来协调 nimbus 和 supervisor。 Kafka 需要 zookeeper 来存储有关集群状态和消费者偏移量的信息。

Zookeeper 基本上提供了一个高可用的文件系统，用户/应用程序可以在其中读取/写入小数据。此数据可以是与通信或交易相关的内容。由于文件系统具有高可用性，因此通信将始终是完整的，不会进入部分或未知状态。 Zookeeper 集群最多可以承受一定数量的故障，具体取决于分区的数量(比如 N)，它可以容忍 N-1 次故障。更多详情，可以引用以下网址1 2 3

关于hadoop - zookeeper和kafka在hadoop 2.6集群中放在哪里，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31651980/

hadoop - zookeeper和kafka在hadoop 2.6集群中放在哪里

上一篇：java - Spark NullPointerException 与 saveAsTextFile

下一篇：hadoop - hbase.master.port 以编程方式覆盖？