Azure Synapse 数据集

标签 azure dataset azure-synapse linked-service

我对 Azure Synapse 非常陌生,并且遇到了“数据集”主题。我很困惑为什么我们需要数据集而不是在创建集成数据集时直接使用对数据文件的引用?

此外,链接服务和数据集之间有什么区别? 我们不能通过链接服务直接链接我们的数据吗?

最佳答案

链接服务

链接服务定义服务级别连接,包括任何所需的身份验证。例如 Azure SQL 数据库、存储帐户、SFTP 服务器等。因此,链接服务引用服务,而不是其中包含的数据。

链接服务可以被多次引用,并且所有数据集都需要链接服务引用。

数据集

数据集定义对链接服务中包含的资源/数据的运行时访问。例如 SQL 表、存储中的容器/文件夹/Blob、SFTP 中的文件等等。数据集类型将决定需要哪种类型的链接服务引用。

数据集非常灵活。他们可以直接指向特定资源,也可以定义参数,或这两种方法的组合。他们可以定义模式,也可以不定义模式。您需要配置一个数据集来满足您的特定需求。

重要的是要了解数据集没有/保存/包含数据。相反,它被特定事件[例如查找、复制、数据流等]用来访问数据。

所以简短的答案是您可以创建对数据的直接引用,但您可以通过数据集来完成。

关于Azure Synapse 数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/76887820/

相关文章:

Azure SQL 数据仓库 : No catalog entry found for partition ID <id> in database <id>. 元数据不一致。运行 DBCC CHECKDB

python - 使用 python 将抓取的数据直接保存到 azure blob 存储

c# - 字符串数组与 C# 中的数据集值进行比较

c# - 如何删除数据集的列?

oracle - 测试数据库以测试 Oracle 中的性能调优技术

Azure Synapse Studio - 工作流程

azure - 预定 1 :1 copy of tables between Azure SQL databases using Data Factory without specifying table schema

python - 无法在 Azure Data Studio 中将内核更改为 Python

azure - 使用 ADF REST 连接器读取和转换 FHIR 数据

azure - 在 Azure 中的同一域下托管 2 个 Web 应用程序