hadoop - Hive Metastore高可用性

标签 hadoop hive cloudera high-availability metastore

在cloudera下,我试图将配置单元metastore配置为高度可用。

所以我按照下面的教程:http://www.cloudera.com/content/www/en-us/documentation/archive/cdh/4-x/4-7-1/CDH4-Installation-Guide/cdh4ig_hive_metastore_configure.html

我的问题是:我是否需要在Hive Metastore Server和复制的数据库之间添加负载均衡器?

因为我认为我们要么需要提供数据库的URI列表以配置元存储服务器,要么需要使用负载均衡器在发生故障时切换到其他数据库。

提前致谢

最佳答案

我找到了解决我的问题的方法:

实际的答案取决于数据库,如果数据库管理HA和故障转移,则不需要负载均衡器,否则在发生故障时需要它。

对于配置部分,我们可以在hive-site.xml中放入与数据库一样多的uri:

<property>
  <name>javax.jdo.option.ConnectionURL</name>
  <value>jdbc:mysql://myhost/metastore,</value>
  <description>the URL of the MySQL database</description>
</property>

关于hadoop - Hive Metastore高可用性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34722746/

相关文章:

apache-spark - 我有56列的表格,想加载46列的数据,我该怎么办?

oracle - 动态Sqoop查询和调度

hadoop - 子查询中的子查询在配置单元中不起作用

apache - Cloudera hadoop的conf目录在哪里?

apache-spark - 使用 pyspark 3.0.0 和 Hive 1.1.0 时,Hive 查询失败,错误代码为 "Unable to fetch table test_table. Invalid method name: ' get_table_req'"

hadoop - Apache PIG-如何减少小数点后的数字

hadoop - Hadoop集群节点数

java - 如何使Hadoop reducer 为单个键输出多个值

hadoop - 如何在 Pig 中检索上一行值

hadoop - 在Scala Play框架中找不到Hadoop MR映射器类