azure - blob 与 adls gen2 ||可以通过 adls2 完成但通过 blob 存储无法完成的事情

标签 azure azure-blob-storage azure-data-factory azure-data-lake azure-data-lake-gen2

我是 azure 世界的新手。我正在研究 blob 存储和 adls2。我观察到,除了空间限制和继承命名空间之外,adls2 能做的一切,同样可以通过 blob 完成。

但人们仍然推荐 adls2 来处理分析工作负载。请告知哪些事情可以通过 adls2 完成但不能通过 blob 存储完成(除了 space 和 herieracial 命名空间)。

最佳答案

Data Lake Storage Gen2 使 Azure 存储成为在 Azure 上构建企业数据湖的基础。 Data Lake Storage Gen2 从一开始就设计为服务多个 PB 的信息,同时维持数百 GB 的吞吐量,让您可以轻松管理大量数据。

Data Lake Storage Gen2 基于 Blob 存储构建,并通过以下方式增强性能、管理和安全性:

性能得到优化,因为您不需要复制或转换数据作为分析的先决条件。与Blob存储上的平面命名空间相比,分层命名空间极大地提高了目录管理操作的性能,从而提高了整体作业性能。

管理更容易,因为您可以通过目录和子目录组织和操作文件。

安全性是可执行的,因为您可以定义目录或单个文件的 POSIX 权限。

此外,Data Lake Storage Gen2 非常经济高效,因为它构建在低成本的 Azure Blob 存储之上。这些附加功能进一步降低了在 Azure 上运行大数据分析的总拥有成本。

ADLS 中的帐户大小、文件大小或文件数量没有限制

有关更多信息,请参阅此 article作者:阿什什·帕特尔

关于azure - blob 与 adls gen2 ||可以通过 adls2 完成但通过 blob 存储无法完成的事情,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71967998/

相关文章:

azure - 下载的许可证不足 Azure/Visual Studio Online 和 Visual Studio 2013

c# - HRESULT : 0x80131040 - Microsoft. WindowsAzure. 未找到存储

Azure BlobClient 与 CloudBlobClient

Azure ADF 报价全部禁用

azure - 将动态内容设置为管道参数的默认值?

azure - Azure IOT 边缘设备模块之间是否可以进行动态路由?

azure terraform 将 azure 文件共享附加到 Windows 计算机

azure - Azure Blob 存储和 Azure databricks 之间的高效数据检索过程

python-3.x - 如何将机器学习模型 pickle 存储到 azure blob 并检索它/

sql-server - 与 Azure 数据工厂同步数据