hadoop - 使用 Apache PIG 创建空表

标签 hadoop apache-pig

是否可以在 Apache Pig 中创建一个空表?

给定表名、列名和列类型,很容易在 Apache Hive 中进行相同的操作:

CREATE TABLE employees(name string, id int)
STORED AS ORC;

最佳答案

您可以做的是在您的项目中创建一个空文件夹,并将其与您的 PigStorage 加载程序结合使用。

例如:

使用 PigStorage 从工作流变量 data 中读取数据: rel = LOAD '$data' 使用 PigStorage('\t');

data 指向包含数据的文件时,您将获得一个非空关系。但是,如果您指向一个空文件夹(真的是空的,也没有架构),您会发现没有代码中断,您最终会得到一个与非空文件夹具有相同架构的空关系。

这意味着您可以运行 FOREACHFILTERJOIN 等。而不会破坏您的 Pig 代码,所有这些都是空洞的。

关于hadoop - 使用 Apache PIG 创建空表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44137572/

相关文章:

Hadoop WordCount.java 依赖问题

hadoop - 如何在 EMR 中使用外部 jar?

hadoop - 在网页上查找唯一身份访问者

hadoop - 带有ToDate内置函数的PIg- NullPointerException

hadoop - Apache pig : Convert bag of tupple to single tupple

database - 从汇总的Weblogs数据中检索信息,该怎么做?

regex - Pig - 使用正则表达式提取字符串

java - Hadoop 外部 jar

sockets - 运行 start-dfs.sh 时权限被拒绝错误

hadoop - 将行值合并到列