我非常想知道有关hadoop hdinsight的一则信息。
这篇来自微软的文章:https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hadoop-use-blob-storage/
解释hadoop内部使用存储帐户来存储数据。
假设上述信息是方法,那么hadoop和存储帐户之间有什么区别。 如果我只想存储文件等信息,我可以只使用存储帐户而不是创建 hdinsight hadoop? 此外,如果 hadoop 'hadoopCluster' 使用存储帐户 'stgAccount' 是否意味着存储帐户 'stgAccount' 空间和 'hadoopCluster' 空间相同吗?
最佳答案
基本上,在 HDInsight 部署中,您有两个部分:
- HDInsight 集群由多个头节点和工作节点(运行软件的虚拟机)组成
- 用于存储数据的 Azure Blob 存储。
Azure Blob 存储是一种安全的分布式数据存储。无论您是否使用 HDInsight,都可以使用它。这只是一个有自己定价的云存储。因此,如果您只想将文件存储在云中,那么您绝对不需要 HDInsight。
HDInsight 群集不是。实际上,您会发现您直接存储在头节点磁盘上的任何内容有时都会消失。
HDInsight 群集可以访问您在创建群集时指定的存储,并且可以向该存储读取/写入数据。
关于.net - 使用 HDInsight hadoop 进行存储,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32324499/