hadoop - 无法使用 PIG 将数据插入 hbase 表

如果我运行->

data = LOAD 'hdfs:/user/zzz/Pokemon.csv' USING PigStorage(',') AS (serial_no:int,name:chararray,type1:chararray,type2:chararray,total:int,hp:int,attack:int,defence:int,sp_attk:int,sp_def:int,speed:int);

我可以通过转储数据看到成功加载数据。
但是在那之后当我运行时->

STORE data INTO 'hbase://pokemons' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('cf:name,cf:type1,cf:type2,cf:total,cf:hp,cf:attack,cf:defence,cf:sp_attk,cf:sp_def,cf:speed');

那么问题就出现了，您可以检查以下内容->

HadoopVersion   PigVersion  UserId  StartedAt   FinishedAt  Features
3.2.1   0.17.0  zzz 2019-12-11 12:57:34 2019-12-11 12:57:43 UNKNOWN

Failed!

Failed Jobs:
JobId   Alias   Feature Message Outputs
job_1576044193401_0008  data    MAP_ONLY    Message: Job failed!    hbase://pokemons,

Input(s):
Failed to read data from "hdfs:/user/zzz/Pokemon.csv"

Output(s):
Failed to produce result in "hbase://pokemons"

Counters:
Total records written : 0
Total bytes written : 0
Spillable Memory Manager spill count : 0
Total bags proactively spilled: 0
Total records proactively spilled: 0

Job DAG:
job_1576044193401_0008


2019-12-11 12:57:43,115 [main] INFO  org.apache.pig.backend.hadoop.executionengine.mapReduceLayer.MapReduceLauncher - Failed!

最佳答案

我不确定发生了什么，但我知道当前的 Pig 没有针对 hadoop 版本 3 或更高版本进行测试。追踪于 https://issues.apache.org/jira/browse/PIG-5253

关于hadoop - 无法使用 PIG 将数据插入 hbase 表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59280896/

上一篇：azure - SPARK:在将Azure Blob存储与Spark群集一起使用时，如何访问AzureFileSystemInstrumentation？

下一篇：bash - 计算多个子目录中每个文件中的行

相关文章：

mysql - Sqoop导入 “--where”标志

hadoop - Pig Latin JOIN 错误

hadoop - 将多个变量存储到单个文件中

hadoop - 将数据同步到 HBase/HDFS 并将其用作 MapReduce 作业的输入

hadoop - 方案 : hdfs 没有文件系统

ubuntu - 运行PIG时出现JAVA_HOME错误

java - 集成外部程序

hadoop - 在Hadoop中，复制因子和集群中的节点数之间有什么关系？

hadoop - 查询以查找hiveQL中不包括前5％的行的平均值

hadoop - HBase 如何在整个集群中分配来自 MapReduce 的新区域？