我是AWS和大数据的新手。我知道集群或分布式计算的概念。如果可以的话,请向您介绍有关Hadoop集群的AWS Docker。谢谢。
最佳答案
我将尝试简单地解释一下。
Docker允许您在Containers内运行,构建和测试代码。而已。除了您可以在EC2 Container Service内运行Docker容器之外,AWS没有其他特定的部分。
请注意,在该描述中我没有对Hadoop或大数据作任何说明。您的容器可以包含任何打包的应用程序,例如Web服务器,数据库,构建工具等。
现在,可以通过使用Hive,Hbase,Spark,数据节点和名称节点等将Hadoop分解为多个容器,只需将每个组件放入单独的容器中并将它们链接在一起就可以形成生态系统。
因此,与其拥有一组联网的计算机集群,不如说是一个可以在任何或多台计算机上的容器集群。因此,通过共享主机的资源而不是为每个服务使用专用硬件,容器具有更大的可伸缩性,轻巧性和便携性。
关于hadoop - AWS Docker和Hadoop集群之间的主要区别是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36433111/