是否需要具有多个节点群集或单个节点群集足以使用分布式缓存。
FileReader可以通过提供文件路径直接打开HDFS中存储的文件。
最佳答案
实际上这不是必须的。使用分布式缓存的主要目的是使资源可用于群集中所有节点上运行的所有映射器或化简器,而在一台计算机上没有多大意义。在单节点hadoop群集上,您可以在mapreduce代码中仅包含一个全局变量,这可以解决问题。
关于java - 在单节点群集上使用分布式缓存和FileReader,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15548365/