我正在阅读 Tom White 撰写的 Hadoop - The Definitive Guide,第 4 版,他在其中写道,
"Block pool storage is not partitioned, however, so datanodes register with each namenode in the cluster and store blocks from multiple block pools."
谁能澄清一下?具体来说,如果...
NameNodeA: blockpool for DataNode1 and DataNode2
NameNodeB: blockpool for DataNode3 and DataNode4
...NameNodeB 是否存储 NodeNameA 的 block 池?这似乎很浪费,因为作者之前写道“namenodes 不相互通信。”
更新:在查看此处的评论并重新阅读之后,它似乎是这样工作的:您可以将命名空间划分为联合名称节点,这些名称节点管理一个分区(例如,/user)但仍然< strong>包含整个命名空间(例如,/user/foo/bar)。
最佳答案
This link更详细地解释了架构。它是由雅虎的一位 Hadoop 提交者创建的。我误以为只有 1 个命名空间,但实际上,您可以有多个命名空间。
关于hadoop - 谁能澄清一下? "Block pool storage is not partitioned...",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45359405/