file - 在 Pig 中使用 LOAD 时排除某些文件被加载

标签 file hadoop load apache-pig hdfs

我试图通过 LOAD 命令将 sqoop 作业的输出加载到 Pig 中。我只想加载以名称“part”开头的文件。如何排除同一文件夹中存在的其他文件被加载。请帮忙。

最佳答案

这样加载,就可以了

A = LOAD 'part*' using PigStorage(',');  
DUMP A;

Example:  
part_input.txt  
1,2,3  
4,5,6  

input.txt
99.0,55.0,56.3
12.4,55.66,78.09

output:
1,2,3
4,5,6

关于file - 在 Pig 中使用 LOAD 时排除某些文件被加载,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26101431/

相关文章:

javascript - 如何(在 javascript、Jquery 或 Ajax 等中)将本地文本文件或 xml 文件加载到变量中?

Java - 解析行

hadoop - 如何限制映射缩减作业中发送到缩减程序的记录数量?

sql - 如何结合具有 avg 和 max 函数的两个配置单元查询?

r - R中的Hadoop wordcount示例

android延迟加载不在手机上显示图像或显示并且速度很慢

R,使用 load() 从 .rda 对象分配内容

c - 在C中的txt文件中搜索单词

c++ - 将文件的元素加载到 C++ 中的二维数组中

c# - 以文件窗口形式打开字节数组