Hadoop 分布

标签 hadoop mapreduce hdfs hadoop2

我正在通过我学习的大学提供的 VNC 软件(远程访问)使用 IBM bigInsights,但我无法通过该桌面访问 Internet。为了使用互联网上的一些数据样本,我决定安装 Hadoop 在我的笔记本电脑(单集群)中,但我发现有很多发行版,那么免费的最好的是什么 Hadoop 作为初学者的培训分布?

1) Amazon Elastic MapReduce
2) Cloudera CDH Hadoop Distribution
3) Hortonworks Data Platform (HDP)
4) MapR Hadoop Distribution
5) IBM Open Platform
6) Microsoft Azure's HDInsight -Cloud based Hadoop Distrbution
7) Pivotal Big Data Suite
8) Datameer Professional
9) Datastax Enterprise Analytics
10) Dell- Cloudera Apache Hadoop Solution.

最佳答案

CDH 和 Hortonworks 是最容易启动和运行单节点集群的方法,并且使用非常广泛,因此您可以找到大量故障排除资源。

如果您只想编写应用程序代码/运行任意 MapReduce 作业而不是学习 Hadoop 系统架构,那么 Amazon EMR 更合适。

关于Hadoop 分布,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48084371/

相关文章:

hadoop - Hive 查询将所有表转储到一个表中

Hadoop block 管理

hadoop - 将文件从 NFS 或本地 FS 复制到 HDFS

apache-spark - 我的PySpark作业在本地模式下运行良好,但在群集模式下失败-已解决

hadoop - 如何在hadoop mapreduce -matrix乘法中格式化输出

java - Java-Hadoop Map Reduce,错误输入,省略csv header

hadoop - 什么时候使用身份映射器/缩减器?

hadoop - 寻找好的例子来理解 Map 阶段不同键的重要性

hadoop - 一些数据节点在清除 HDFS 后仍然显示使用的 block 池

hadoop - 无法从 Apache Nifi 连接到 Docker 中的 Hadoop