知道 hive 使用 metastore 和 hdfs,是否可以将从正在运行的 hadoop-hive 集群获取的 hdfs 快照恢复到新的 hadoop-hive 集群?
我认为必须执行的一个步骤是在 hive 中再次创建表,但是这些表会自动连接到快照文件吗?
有关此主题的一个链接位于 Apache Mail Archives .我希望对此是否有更新或更好的答案。
最佳答案
Hive 使用 2(元数据 + hdfs 中的仓库数据)
试一试:(没查过,请注意)
1) 使用dstcp将当前Hadoop-hive Cluster中的hive仓库数据复制到新的Hadoop-hive Cluster中
$ hadoop distcp hftp://old-custer:50070/user/hive/warehouse hdfs://new-Cluster/user/hive/warehouse
2) 假设您的元数据存储在 MySQL 中(不在默认的 derby 中),将您的新配置单元指向旧的元数据 mysql 服务器(在新集群的 hive-site.xml 中)。这样您就无需再次创建模式/表。
关于hadoop - hdfs snapshot可以用来恢复hive吗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24294753/