hadoop - 是否可以在单独安装 Hadoop 和其他几个组件的 RHEL7 服务器上安装 CDH

标签 hadoop bigdata cloudera cloudera-cdh rhel7

我有一个 RHEL7 服务器,我试图在其中创建一个用于 POC 和学习目的的通用数据湖平台。我分别设置了Hadoop、Hive、Zookeeper、Kafka、Spark、Sqoop

单独安装这些组件被证明是一件棘手的事情,并且需要花费很多精力,即使这是出于内部目的而不是特定于生产。

我现在正在尝试在此服务器中安装 CDH 包。 有可能这样做吗?它会与当前的安装重叠吗? 如何实现。

注意:我们进行单独安装的原因是当时服务器中的互联网不可用

现在选择 CDH 的原因是在获得一些批准后几天可以使用互联网,加上 CDH 节省了大量时间和精力,并且包括 设置数据湖所需的组件。

有人可以帮我解决这个问题吗

最佳答案

是的,在不干扰 docker 现有配置的情况下设置 CDH 是可行的。查看以下链接以获取设置指南。我已经对此进行了测试,即使我有单独的工具设置,它也能正常工作。

https://www.cloudera.com/documentation/enterprise/5-6-x/topics/quickstart_docker_container.html

关于hadoop - 是否可以在单独安装 Hadoop 和其他几个组件的 RHEL7 服务器上安装 CDH,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56216218/

相关文章:

hadoop - 使用Hadoop及相关项目分析不断变化的使用模式

java -/conf 目录在 Hadoop 2.5.1 中丢失错误

java - Apache Flink 将结果减少为多个值而不是一个

hadoop - Cloudera CDH4 : Can't add a host to my cluster because canonical name is not consistent with hostname

hadoop - 如何以用户身份使用 ResourceManager Web 界面

hadoop - 如何加入并在PIG中寻找值(value)?

hadoop - hdfs moveFromLocal 不会跨数据节点分发副本 block

hadoop - Hadoop Map/Reduce作业进度计数器

hadoop - Hadoop性能基准

hadoop - 在 Ambari 上设置集群时确认单节点集群的主机失败