database - 执行查询时,hive 是否运行 hadoop?

标签 database hadoop hive

我正在尝试了解 hive 和 hadoop 是如何交互的。从我读过的教程看来,在运行 HIVE 查询之前,您运行一个 map/reduce 作业来获取输入数据。这对我来说似乎适得其反,如果我已经运行 map/reduce 作业并以易于解析的格式获取数据,为什么我不将数据放入传统数据库中。

感谢您的帮助, 弥敦道

最佳答案

Hive 对存储在 HDFS 上的文件进行操作。除了最简单的查询之外,Hive 会生成并运行 mapreduce 作业。对于非常简单的查询(SELECT * FROM MyTable),它只会将文件流出磁盘。

输入数据不需要来自 MapReduce - 它可以是上传到 HDFS 的简单文本文件。参见 http://developer.yahoo.com/hadoop/tutorial/module2.html#commandref

关于database - 执行查询时,hive 是否运行 hadoop?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10249020/

相关文章:

sql - 来自子查询在oracle中给出错误

java - 配置单元查询无法通过 jdbc 生成结果集

java - 如何在hadoop WordCount应用程序中获取所有标记词的文件名?

hadoop - 读取配置单元中的嵌套标记xml文件

sql - 不在 Hive QL 中

sql - UNIQUE会自动添加索引吗?

database - 创建 Informix 函数时出错

mysql - 当我尝试删除数据库并且使用 mysql 作为元存储时,为什么 Hive 会给出元异常?

java - 用于本地高分的 Android 应用程序的 SQLite 数据库。如何打开所有数据然后覆盖所有数据?

hadoop - Hadoop远程文件创建失败