hadoop - hdfs snapshot可以用来恢复hive吗

知道 hive 使用 metastore 和 hdfs，是否可以将从正在运行的 hadoop-hive 集群获取的 hdfs 快照恢复到新的 hadoop-hive 集群？

我认为必须执行的一个步骤是在 hive 中再次创建表，但是这些表会自动连接到快照文件吗？

有关此主题的一个链接位于 Apache Mail Archives .我希望对此是否有更新或更好的答案。

最佳答案

Hive 使用 2(元数据 + hdfs 中的仓库数据)

试一试:(没查过，请注意)

1) 使用dstcp将当前Hadoop-hive Cluster中的hive仓库数据复制到新的Hadoop-hive Cluster中

$ hadoop distcp hftp://old-custer:50070/user/hive/warehouse hdfs://new-Cluster/user/hive/warehouse

2) 假设您的元数据存储在 MySQL 中(不在默认的 derby 中)，将您的新配置单元指向旧的元数据 mysql 服务器(在新集群的 hive-site.xml 中)。这样您就无需再次创建模式/表。

关于hadoop - hdfs snapshot可以用来恢复hive吗，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24294753/

相关文章：

apache-spark - Spark 作为 HDFS 的数据摄取/载入