apache-pig - 使用 JsonStorage 和 Apache Pig 保存为 bz2 格式

标签 apache-pig bzip2

有没有办法在 JsonStorage 中使用 bz2 来存储数据?

我试过了

STORE DATA INTO 'path_to_file.bz2’ USING JsonStorage();

但这并不成功。

我可以使用 PigStorage 来完成此操作,但它使用字符分隔符而不是 json 来分隔字段。

最佳答案

1) 在脚本开头打开压缩:

SET mapred.output.compress 'true';
SET mapred.output.compression.codec 'org.apache.hadoop.io.compress.BZip2Codec';

2)存储数据。

STORE DATA INTO 'path_to_file’ USING JsonStorage();

目录中的结果文件应该是 bz2 压缩的。

关于apache-pig - 使用 JsonStorage 和 Apache Pig 保存为 bz2 格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22036062/

相关文章:

compression - TAR 文件格式问题

hadoop - 我在哪里可以学习使用 Pig 而无需设置 Hadoop

hadoop - pig 本地模式溢出数据问题

hadoop - 将数据从 pig 加载到 elasticsearch

javascript - JavaScript 中的 bz2

c++ - 来自 boost::iostreams::copy() 的异常

java - 将Java解密代码迁移到Golang

c++ - boost::iostream bzip2_decompressor 不解压缩由 bzip2_compressor 压缩的文件

hadoop - 在 Oozie 工作流的 Pig Action 中传递 JVM 选项以指向 log4j.properties 文件

apache-pig - 如何在 PIG 中显示声明的变量