hadoop - 使用 Apache PIG 创建空表

是否可以在 Apache Pig 中创建一个空表？

给定表名、列名和列类型，很容易在 Apache Hive 中进行相同的操作:

CREATE TABLE employees(name string, id int)
STORED AS ORC;

最佳答案

您可以做的是在您的项目中创建一个空文件夹，并将其与您的 PigStorage 加载程序结合使用。

例如:

使用 PigStorage 从工作流变量 data 中读取数据: rel = LOAD '$data' 使用 PigStorage('\t');

当 data 指向包含数据的文件时，您将获得一个非空关系。但是，如果您指向一个空文件夹(真的是空的，也没有架构)，您会发现没有代码中断，您最终会得到一个与非空文件夹具有相同架构的空关系。

这意味着您可以运行 FOREACH、FILTER、JOIN 等。而不会破坏您的 Pig 代码，所有这些都是空洞的。

关于hadoop - 使用 Apache PIG 创建空表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44137572/

相关文章：

Hadoop WordCount.java 依赖问题