假设我有 1TB 的数据并将复制因子设置为 2,那么它会生成 2 个副本,那么我的整个集群是否需要 3TB 的总空间 - 1TB 用于原始数据,2TB 用于副本,还是仅 2TB?
最佳答案
仅 2TB - 复制因子包括数据的所有副本。
关于hadoop - Hadoop 大数据中的复制因子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28869597/
假设我有 1TB 的数据并将复制因子设置为 2,那么它会生成 2 个副本,那么我的整个集群是否需要 3TB 的总空间 - 1TB 用于原始数据,2TB 用于副本,还是仅 2TB?
最佳答案
仅 2TB - 复制因子包括数据的所有副本。
关于hadoop - Hadoop 大数据中的复制因子,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28869597/