hive 架构:

元存储配置:

我无法理解以下内容:

1)Hive架构图中的Hive Services是什么？我们说 hiveserver2 是一样的吗？

2)Hive架构图中的Driver是什么？

3) 什么是 MetaStore(我不是指的是 Metastore 数据库)。它是运行的某个进程吗？如果是这样，这是 hiveserver2 的一部分吗？根据图表 MetaStore 可以是远程的，所以如果这是一个 JVM 进程，它属于哪个组件？

4) 它说 Hive service JVM , MetaStore JVM Server。但是，这些组件在哪里安装？它们是“ hive ”的“服务器”端的一部分吗？

5) 在“Hive Architecture”图中，它说“Hive Server”？这是什么？这是我们所说的“Hive Server 1”、“Hive Server2”吗？

任何人都可以帮助理解这一点吗？

最佳答案

JDBC/ODBC 或 Thrift 接口(interface)有驱动程序。
还有解释查询并将其编译为执行引擎代码的进程。我个人称其为解释器或编译器，而不是驱动程序

不是 HiveServer2 的一部分。它实际上是一个运行在 RDBMS 之上的进程(是的，在运行 Hive 和 Hadoop 时你仍然需要这些)。

支持的远程 Metastore 服务器 = Oracle、MySQL、Postgres
嵌入式 Metastore(不推荐用于生产)= Derby

Metastore JVM

橙色框表示您可以将这些服务部署为与驱动程序(解释器)相同的 JVM 的一部分或远程服务器。 wiki 描述了这些设置。

我相信这是一个将 HiveServer2 查询映射到 MetaStore 查询的辅助进程。例如，如何将 HiveQL 转换为从 MySQL 或 Postgres 读取元数据的进程？

它可以在服务器端运行，是的，但出于容错和性能原因，这不是推荐的设置。

HiveServer1 is deprecated .随意阅读它，但不要使用它。

关于hadoop - Hive 服务、HiveServer2 和 MetaStore 服务？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49799838/