hadoop - Hive - 选择计数 (*) 不与 Tez 一起使用但与 MR 一起使用

标签 hadoop hive mapreduce hiveql tez

我有一个包含 Parquet 数据的 Hive 外部表。

当我运行 select count(*) from table1 时,它因 Tez 而失败。

但是当执行引擎更改为 MR 时,它就可以工作了。知道为什么 Tez 失败了吗?我在使用 Tez 时遇到以下错误:

Error: org.apache.hive.service.cli.HiveSQLException: Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.tez.TezTask at org.apache.hive.service.cli.operation.Operation.toSQLException(Operation.java:380) at org.apache.hive.service.cli.operation.SQLOperation.runQuery(SQLOperation.java:257) at org.apache.hive.service.cli.operation.SQLOperation.access$800(SQLOperation.java:91) at org.apache.hive.service.cli.operation.SQLOperation$BackgroundWork$1.run(SQLOperation.java:348) at java.security.AccessController.doPrivileged(Native Method) at javax.security.auth.Subject.doAs(Subject.java:422) at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1698) at org.apache.hive.service.cli.operation.SQLOperation$BackgroundWork.run(SQLOperation.java:362) at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511) at java.util.concurrent.FutureTask.run(FutureTask.java:266) at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) at java.lang.Thread.run(Thread.java:748) (state=08S01,code=1)

最佳答案

您必须将 tez.tar.gz 文件放在 hdfs 上。我想你可能会错过这一步。

在hdfs上创建一个apps文件夹

hdfs dfs -mkdir -p /hadoop/apps/tez/

放入tez.tar.gz文件

hdfs dfs -put /usr/hadoop/tez/lib/tez.tar.gz /hadoop/apps/tez/

授予该文件夹和tar的权限

hdfs dfs -chown -R $HDFS_USER:$HADOOP_USER /hadoop
hdfs dfs -chmod -R 555 /hadoop/apps/tez
hdfs dfs -chmod -R 444 /hadoop/apps/tez/tez.tar.gz

关于hadoop - Hive - 选择计数 (*) 不与 Tez 一起使用但与 MR 一起使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49503973/

相关文章:

hadoop - Mapreduce XML 输入格式 - 构建自定义格式

hadoop - 如何确定Hive中的动态分区数

hadoop - 使用 Hadoop 的 Yarn 任务中的 InvocationTargetException

bash - HDFS 上的 Snappy 压缩文件没有扩展名且不可读

hadoop - HIVE:INSERT 上的列引用无效。在选择中工作,而不是在与插入结合时

hadoop - 我可以将不同文件格式的数据保存在同一个配置单元表中吗?

hadoop - Windows 平台上是否有 Hortonwork Data 平台的管理器

algorithm - map reduce算法的并行效率计算公式是什么?

python - Hadoop 集群 - 在运行作业之前,我是否需要在所有机器上复制我的代码?

java - 如何将 Hazelcast 与 Hbase 连接?