hadoop - hive ， pig ， map 减少用例之间的区别

标签 hadoop mapreduce hive apache-pig

map-reduce，hive，pig之间的区别

pig:它是一种数据流语言，它可以处理基本上用于将半结构，非结构化数据转换为结构的任何数据，以便可以使用窗口功能等在 hive 高级分析中使用。

hive :处理结构数据并提供sql类型的查询语言。

我知道在后端， pig 和 hive 都使用map-reduces。

我知道map-reduce对于程序员，hive或pi的 pig 来说都是很好的工具

我只想知道我们在进行hive，pig和map-reduce的任何特定用例

基本上，我们决定必须在此处使用pig或在这里使用map -reduce。

最佳答案

Map-Reduce:具有比 pig 或 hive 更好的性能，但需要更多的开发时间。

PIg:与map-reduce相比，开发时间更少，但性能却很差。

Hve:SQL类型语言，具有一些很好的功能，例如分区和存储区，以提高读取性能。此外，hive在读取时强制执行模式。

关于hadoop - hive ， pig ， map 减少用例之间的区别，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/26634263/

上一篇：hadoop - 读取BinStorage存储的数据集(从外部工具)

下一篇：azure - 带有HDInsight的Azure Blob存储是否在完整行上拆分文件？

相关文章：

hadoop - Hadoop Pig拉丁元组:如何将它们传递给UDF？

hadoop - 使MapReduce程序读取数据有哪些不同的方式？

mysql - 配置单元查询错误无效的表别名

ruby - 使文件在Elastic MapReduce上本地可用

java - Appengine Mapreduce 受限类 ManagementFactory

google-app-engine - GAE MapReduce 并行性和配额

hadoop - 使用 multidelimeter 在配置单元中插入数据

hadoop - 如何在Redhat上安装Hive？

mysql - HiveQL:在一对多表中查找第 N 个值

hadoop - map 侧连接的理论/程序是什么