我想使两个应用程序实例共享一个HDFS群集,但是该应用程序的每个实例都需要自己的Hive数据库。
有没有一种方法可以在群集中配置多个独立的Hive服务器/元存储,以便每个应用程序都可以使用群集中的数据?
最佳答案
each instance of the application requires its own Hive database
然后在Hive中执行
CREATE DATABASE my_own_database;
。在其他应用程序中进行任何查询之前,请先运行
USE my_own_database;
或SELECT * FROM my_own_database.table
否则,请确保您必须安装并配置指向其他数据库(甚至是单独的服务器)的单独的Hive Metastore Java进程。
在hive-site.xml中
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:<protocol>://<host>:<port>/<databasename></value>
</property>
然后,您的应用程序将必须设置
hive.metastore.uris
指向该实例
关于hadoop - 我们可以在同一群集中安装多个配置单元服务器吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56443405/