hadoop - 跳过mapreduce中具有特定值(value)的记录

标签 hadoop mapreduce hdfs

我有一个包含许多记录的数据集。
考虑记录的前两个字段是field1和field2。
如果field1或field2的值为AA,则必须在映射过程中跳过此记录。
请帮助我的程序。

最佳答案

在mapper类中,您可以将if条件设置为

if((field1!='AA')||(field2!='AA')){

 //your code here
}

如果条件将跳过具有值“ÁA”的字段,您将能够处理其余记录,并将结果返回到上下文。

关于hadoop - 跳过mapreduce中具有特定值(value)的记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43025120/

相关文章:

hadoop - 在 HDFS 中的特定文件/ block 上运行 Map-Reduce 作业

java - 如何修复 src 文件系统问题上的资源更改

hadoop - assertThat()方法是什么?

java - 从 HDFS 下载大文件

hadoop - 如何刷新Hadoop分布式缓存?

java - 具有 MultipleInputs 的 Hadoop 映射器的控制流程是什么?

exception - 格式化 HDFS 时出现 UnknownHostException

java - 有没有办法限制 MapReduce 程序的节点数?

hadoop - Nifi 错误 Wwth putsolrcontentstream 处理器

hadoop - 运行配置单元查询,并收集作业信息