hadoop - hive , pig , map 减少用例之间的区别

标签 hadoop mapreduce hive apache-pig

map-reduce,hive,pig之间的区别

pig:它是一种数据流语言,它可以处理基本上用于将半结构,非结构化数据转换为结构的任何数据,以便可以使用窗口功能等在 hive 高级分析中使用。

hive :处理结构数据并提供sql类型的查询语言。

我知道在后端, pig 和 hive 都使用map-reduces。

我知道map-reduce对于程序员,hive或pi的 pig 来说都是很好的工具

我只想知道我们在进行hive,pig和map-reduce的任何特定用例

基本上,我们决定必须在此处使用pig或在这里使用map -reduce。

最佳答案

Map-Reduce:具有比 pig 或 hive 更好的性能,但需要更多的开发时间。

PIg:与map-reduce相比,开发时间更少,但性能却很差。

Hve:SQL类型语言,具有一些很好的功能,例如分区和存储区,以提高读取性能。此外,hive在读取时强制执行模式。

关于hadoop - hive , pig , map 减少用例之间的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26634263/

相关文章:

hadoop - Hadoop Pig拉丁元组:如何将它们传递给UDF?

hadoop - 使MapReduce程序读取数据有哪些不同的方式?

mysql - 配置单元查询错误无效的表别名

ruby - 使文件在Elastic MapReduce上本地可用

java - Appengine Mapreduce 受限类 ManagementFactory

google-app-engine - GAE MapReduce 并行性和配额

hadoop - 使用 multidelimeter 在配置单元中插入数据

hadoop - 如何在Redhat上安装Hive?

mysql - HiveQL:在一对多表中查找第 N 个值

hadoop - map 侧连接的理论/程序是什么