hadoop - Apache Hadoop 与谷歌大数据

标签 hadoop comparison hdfs bigdata gfs

  1. 任何人都可以向我解释 Apache Hadoop 与 Apache Hadoop 之间的主要区别吗 谷歌大数据
  2. 哪个更好(hadoop 或 google 大数据)。

最佳答案

简单的答案是..这取决于你想用你的数据做什么。

Hadoop 用于海量数据存储和数据的批处理。它非常成熟、流行,并且有很多库支持这项技术。但是如果你想做实时分析,对你的数据的查询 hadoop 不适合它。

Google 的 Big Query 就是专门为解决这个问题而开发的。您可以使用 Google 的大查询对您的数据进行实时处理

您可以使用 Big Query 代替 Hadoop,或者您也可以将 Big Query 与 Hadoop 结合使用来查询运行 MapReduce 作业生成的数据集。

因此,这完全取决于您希望如何处理数据。如果批处理模型是必需的并且足够了,你可以使用 Hadoop,如果你想要实时处理,你必须选择谷歌的。

编辑:您还可以探索可与 Hadoop 一起使用的其他技术,例如 Spark , Storm , Hive等..(并根据您的用例进行选择)

更多探索的一些有用链接:

1:gavinbadcock's blog

2:cloudacademy's blog

关于hadoop - Apache Hadoop 与谷歌大数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30276321/

相关文章:

hadoop - 我们如何在 Hive 中实现货币转换?

java - Mongo-Hadoop 简单测试因 NPE 而失败

hadoop - 替换 ZooKeeper 服务器

ios - 比较下载的图像和保存的图像?

C++ - 无法使用运算符重载比较 const 和非常量模板类型

hadoop - 如何获取运行hadoop hdfs命令时调用的Java类的列表?

python - 比较来自 2 个以上列表的对象

file - 无法从 map 写入 hadoop 文件系统 (HDFS)

hadoop - 无法在 HDFS "datanode"中写入数据 - 节点已添加到排除列表中

hadoop - [hdfs]如何为每个datanode配置不同的dfs.datanode.data.dir?