hadoop - 位置变量上的 pig 过滤器

我正在尝试过滤位置变量。

X = FILTER C BY($14 matches '.*USD.*');
STORE X into '$output' using PigStorage(',');

上面的语句不起作用，但如果我尝试只输出 $14

E = FOREACH C GENERATE FLATTEN($14);
STORE C into '$output' using PigStorage(',');

它工作正常

样本数据:

304a285281be,1383027928890968764,receiver,10C,655362,C2,USD811289,1,0,0,ebay_checkout,cc,cc,USD2659,USD120
304a285281be,1383027928890968764,receiver,10C,655362,C2,USD811289,1,0,0,ebay_checkout,cc,cc,USD2659,USD0
304a285281be,1383027928890968764,receiver,10C,655362,C2,USD811289,1,0,0,ebay_checkout,cc,cc,USD2659,GBP0

样本输出

304a285281be,1383027928890968764,receiver,10C,655362,C2,USD811289,1,0,0,ebay_checkout,cc,cc,USD2659,USD0
304a285281be,1383027928890968764,receiver,10C,655362,C2,USD811289,1,0,0,ebay_checkout,cc,cc,USD2659,GBP0

最佳答案

在 'BY' 和 '(' 之间添加一个空格

    X = FILTER C BY (FLATTEN($14) matches '.*USD.*');
    STORE X into '$output' using PigStorage(',');

关于hadoop - 位置变量上的 pig 过滤器，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39376986/

上一篇：node.js - 在ubuntu 14.04上执行dockerode npm的以下代码后出现错误 "connect EACCES/var/run/docker.sock"

下一篇：docker - 无法将 Spring Boot 应用程序连接到 Docker Mysql 容器 - 未知数据库

相关文章：

hadoop - Hadoop tmp目录变得巨大

hadoop - 使用外部 java 库的 pig UDF

hadoop - HDFS NFS 启动错误 : “ERROR mount.MountdBase: Failed to start the TCP server...ChannelException: Failed to bind..."

hadoop - 将SAS数据集加载到Hadoop中

hadoop - pig : Running two aggregation functions

hadoop - 在本地或 mapreduce 模式下运行 pig 时出现问题

hadoop - 使用自定义 block 结构将文件加载到HDFS

scala - 将多个小文件合并到 Spark 中的几个大文件中

Hadoop:如果 Pig 中的字段为空，则创建空包

hadoop - 如何在 Pig 脚本的 foreach 循环中运行存储