Hadoop 计算所有拆分中所需的术语

标签 hadoop parameters sharing

我想在 hadoop 框架中的所有拆分之间共享一些数据,更具体地说,我有一个文件,其中包含很多我关心的搜索术语,并写下每个文档中出现的次数,但是问题是如果这个词没有出现在某些拆分中,我需要为这个文件返回 0,但是我无法将我正在搜索的术语传递给拆分中的所有节点的问题,任何人都可以给我一些想法

最佳答案

通常,DistributedCache 是跨节点共享数据的方式。然而,由于它已被弃用,请查看此 answer .

关于Hadoop 计算所有拆分中所需的术语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20399603/

相关文章:

c# - 如何在 ASP.Net 中解析和重建 URL?

java - 在运行时,获取传递给方法的参数/参数的数量,无论是否带有可变参数,在 Java 中

android - 通过 WhatsApp 发送消息

iphone - 有没有开源框架可以轻松实现SLComposeViewController的社交分享?

hadoop - 停止 MapReduce 作业,RunningJob#killJob 与 YarnClient#killApplication

java - ant build for eclipse 无法解析 log4j

r - 容器运行超出虚拟内存限制

java - 使用 camel 从 FTP 动态重命名文件

function - 为什么我没有通过任何错误时会收到 "Too many input arguments"错误?

c# - .NET 和 Silverlight 之间共享代码的可行性?