我知道如何更改 hadoop 中的 block 大小。更改 block 大小后会发生什么,namenode 如何将 perivous datanode 更改为当前大小。如果我的集群非常大,并且我在以前的数据节点上的数据节点上提交作业,那仍然不会取消对当前大小的更改。这是如何由名称节点管理的。
最佳答案
什么都没有发生。事实上, block 大小是单个文件的属性。您在配置中定义的是默认值。您可以在 HDFS 中放置或创建文件时指定 block 大小。该属性作为名称节点元数据的一部分与文件的元数据一起存储。如果未指定任何内容,则使用默认值。
当访问文件时,会使用文件的 block 大小属性并对文件进行相应的处理。这是根据所选的 InputFormat 完成的。
底线是多个文件可以存在于具有不同 block 大小的单个 HDFS 集群中。您在配置中定义的是默认值。如果您更改它,它将用于未指定 block 大小的任何新创建操作。希望这能澄清。
关于hadoop - 更改 hadoop 中的 block 大小后会发生什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20186074/