hadoop - Hadoop 大数据中的复制因子

假设我有 1TB 的数据并将复制因子设置为 2，那么它会生成 2 个副本，那么我的整个集群是否需要 3TB 的总空间 - 1TB 用于原始数据，2TB 用于副本，还是仅 2TB？

最佳答案

仅 2TB - 复制因子包括数据的所有副本。

关于hadoop - Hadoop 大数据中的复制因子，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28869597/

相关文章：

hadoop - Hadoop Map Reduce 中的 TSV 输入