我计划在基于Web的应用程序中实现Hadoop框架。但是我只是将其托管在本地主机中。我打算将mapreduce和hdfs实现为分布式文件系统。问题是,我要做的第一步是什么?我应该从什么开始呢?我对Hadoop框架进行了深入研究。关于它的工作原理,请尝试从Internet上下载wordcount示例。
最佳答案
Hadoop是用于大规模数据处理的分布式框架。您的声明
“我正在计划将mapreduce和hdfs实现为分布式文件系统。”是错的。
Map reduce是一种可以在分布式文件系统上使用的编程模型。 HDFS是hadoop分布式文件系统。在hadoop框架中一起设置了HDFS和MapReduce。
使用hadoop可以脱机进行数据处理,这是批处理。因此,直接在Web应用程序中可能没有用。您可以做的是,将后端数据库作为Web应用程序的HBase。 Hbase是在hadoop之上运行的数据仓库/数据库。
如果要开始的第一步是设置计算机集群。可以从5个节点开始。否则,我会推荐云解决方案。去Amazon EMR。
让我知道这是否有帮助!
关于java - 如何在现有系统中实现Hadoop框架,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28304034/