map-reduce,hive,pig之间的区别
pig:它是一种数据流语言,它可以处理基本上用于将半结构,非结构化数据转换为结构的任何数据,以便可以使用窗口功能等在 hive 高级分析中使用。
hive :处理结构数据并提供sql类型的查询语言。
我知道在后端, pig 和 hive 都使用map-reduces。
我知道map-reduce对于程序员,hive或pi的 pig 来说都是很好的工具
我只想知道我们在进行hive,pig和map-reduce的任何特定用例
基本上,我们决定必须在此处使用pig或在这里使用map -reduce。
最佳答案
Map-Reduce:具有比 pig 或 hive 更好的性能,但需要更多的开发时间。
PIg:与map-reduce相比,开发时间更少,但性能却很差。
Hve:SQL类型语言,具有一些很好的功能,例如分区和存储区,以提高读取性能。此外,hive在读取时强制执行模式。
关于hadoop - hive , pig , map 减少用例之间的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26634263/