java - Apache Pig 分配和解析计数问题

标签 java apache-pig hortonworks-sandbox

目前正在使用 Hadoop 学习 Apache Pig,并使用 6200 万的庞大数据集。只是尝试执行正常的 COUNT 函数并不断出现错误。我分配了 8G 的 RAM,我可以轻松地使用 HIVE 来完成,但似乎遇到解析问题或堆分配问题,每次都不同。我在虚拟机上使用hadoop。

错误是:

file script.pig, line 3, column 39> Failed to generate logical plan. Nested exception: org.apache.pig.backend.executionengine.ExecException: ERROR 1070: Could not resolve count using imports: [, java.lang., org.apache.pig.builtin., org.apache.pig.impl.builtin.]

ERROR org.apache.pig.PigServer - exception during parsing: Error during parsing. Could not resolve count using imports: [, java.lang., org.apache.pig.builtin., org.apache.pig.impl.builtin.]

ERROR 1070: Could not resolve count using imports: [, java.lang., org.apache.pig.builtin., org.apache.pig.impl.builtin.]

ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1070: Could not resolve count using imports: [, java.lang., org.apache.pig.builtin., org.apache.pig.impl.builtin.]

我的 pig 代码

a = LOAD 'bigData_orc' using org.apache.hive.hcatalog.pig.HCatLoader();
b = group a ALL;
c = foreach b generate group as rap, count(a) as counter;
dump c;`

最佳答案

Could not resolve count

尝试将 COUNT() Pig 函数大写

关于java - Apache Pig 分配和解析计数问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39130220/

相关文章:

hadoop - pig : How to save relation when "Scalar has more than two rows in the output"

hadoop - Pig - FilterFunc 不接受整个元组

apache-pig - Apache Pig rank函数的使用

scala - HiveContext 未读取 Orcfile 的模式

hadoop - 具有HDP 2.2或2.5安装的FIWARE COSMOS

java - 两种洗牌方法中哪种效果更好?

java - Windows 上从 Java 到 C++ 的高效数据传输

java - 如何通过java POI api从Excel工作表中删除所有公式?

java - 我不知道为什么最后一种情况(默认)不起作用

apache-kafka - 无法从我的 Windows 主机上的端口 6667 连接到 Hortonworks Sandbox (HDP 2.6) 上的 Kafka Broker