是否可以将记录分隔符从换行符更改为其他字符串,以便将带有换行符的文件读入 pig 中的单个元组。
最佳答案
是的。
A = LOAD '...' USING PigStorage(',') AS (...); //comma is the delimeter for fields
SET textinputformat.record.delimiter '<delimeter>'; // record delimeter, by default it is `\n`. You can change to any delimeter.
关于hadoop - 读取带有换行符的文件作为 pig 中的元组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30160426/