apache - 如何在完全分布式集群中使用Apache Hive

标签 apache hadoop hive hbase hdfs

我正在使用具有3个数据节点和一个namenode的hadoop 1.2.1。我的hbase版本是0.94.14。我已经在名称节点计算机上配置了Apache Hive 1.0。
我必须将hbase表数据导入到配置单元。当我运行查询时，它在日志文件中给出以下错误

ERROR org.apache.hadoop.hbase.mapreduce.TableInputFormatBase - Cannot resolve the host name for /192.168.3.9 because of javax.naming.NameNotFoundException: DNS name not found [response code 3]; remaining name '9.3.168.192.in-addr.arpa'

我的设置中有什么问题。我已按照this教程进行hadoop安装。
在hadoop namenode日志文件中，当我在配置单元中运行查询时，出现以下警告

WARN org.apache.hadoop.hdfs.server.namenode.FSEditLog: Cannot roll edit log, edits.new files already exists in all healthy directories:

hive 是否需要有关多少个datanode hadoop的信息？
我的Hmaster也在其他计算机上运行，并且我在namnode计算机/

最佳答案

您的Hadoop，Zookeeper，HBase和Hive应该处于运行状态。

1) COPY THESE FILES TO THE HADOOP LIBRARY.
    sudo cp /usr/lib/hive/lib/hive-common-0.7.0-cdh3u0.jar  /usr/lib/hadoop/lib/
    sudo cp /usr/lib/hive/lib/hbase-0.90.1-cdh3u0.jar  /usr/lib/hadoop/lib/

2)STOP HBASE AND HADOOP USING FOLLOWING COMMONDS
/usr/lib/hadoop/bin/stop-all.sh
/usr/lib/hbase/bin/stop-hbase.sh

3) RESTART HBASE AND HADOOP USING COMMONDS 
 /usr/lib/hadoop/bin/start-all.sh
/usr/lib/hadoop/bin/start-hbase.sh

关于apache - 如何在完全分布式集群中使用Apache Hive，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28696291/

上一篇：hadoop - org.apache.hadoop.mapreduce.lib.input.SequenceFileRecordReader.close处的java.lang.NullPointerException

下一篇：hadoop - 在群集计算机上执行命令

相关文章：

hadoop - Hive 表的基于时间的查询

java - 这是 Apache + Tomcat 之间的虚假 SSL 连接吗？

django - 如何调试从计算机到服务器的连接，服务器端

scala - 线程 “main” org.apache.hadoop.mapred.InvalidInputException中的异常

hadoop - 从 hdfs 加载数据到 hive 结果表中输出 null

amazon-s3 - 关于 Amazon EMR 上的流式作业流程的问题

hadoop - 无法将数据从 HDFS 加载到 Hadoop 中的 Hive

macos - mac os 上的 XAMPP - Apache 无法启动

php - 无法可靠地确定 MacBook 服务器的完全限定域名

sql - 加入Apache Hive 0.14更新和删除查询