hadoop - 读取带有换行符的文件作为 pig 中的元组

标签 hadoop apache-pig

是否可以将记录分隔符从换行符更改为其他字符串,以便将带有换行符的文件读入 pig 中的单个元组。

最佳答案

是的。

A = LOAD '...' USING PigStorage(',') AS (...); //comma is the delimeter for fields
SET textinputformat.record.delimiter '<delimeter>'; // record delimeter, by default it is `\n`. You can change to any delimeter.

关于hadoop - 读取带有换行符的文件作为 pig 中的元组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30160426/

相关文章:

hadoop - 在 PIG 中连接带有时间戳的文件

hadoop - 使用Pig存储在Hbase中时出错

hadoop - 如何在 Pig 中做条件 JOIN?

hadoop - DataNode 和 TaskTracker 在不同的机器上?

hadoop - 在localhost/127.0.0.1处关闭NameNode

java - 从我的桌面连接到 Cloudera VM

windows - Windows 7 上没有 Hadoop 的 Pig

hadoop - 有没有办法在 pig 脚本中检查 "Path or file exists"

hadoop - 在map/reduce任务中拆分键/值输入文件

具有 HDFS 文件读/写的 Java