我有一个 RHEL7 服务器,我试图在其中创建一个用于 POC 和学习目的的通用数据湖平台。我分别设置了Hadoop、Hive、Zookeeper、Kafka、Spark、Sqoop。
单独安装这些组件被证明是一件棘手的事情,并且需要花费很多精力,即使这是出于内部目的而不是特定于生产。
我现在正在尝试在此服务器中安装 CDH 包。 有可能这样做吗?它会与当前的安装重叠吗? 如何实现。
注意:我们进行单独安装的原因是当时服务器中的互联网不可用。
现在选择 CDH 的原因是在获得一些批准后几天可以使用互联网,加上 CDH 节省了大量时间和精力,并且包括 设置数据湖所需的组件。
有人可以帮我解决这个问题吗
最佳答案
是的,在不干扰 docker 现有配置的情况下设置 CDH 是可行的。查看以下链接以获取设置指南。我已经对此进行了测试,即使我有单独的工具设置,它也能正常工作。
https://www.cloudera.com/documentation/enterprise/5-6-x/topics/quickstart_docker_container.html
关于hadoop - 是否可以在单独安装 Hadoop 和其他几个组件的 RHEL7 服务器上安装 CDH,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56216218/