我对 Azure Synapse 非常陌生,并且遇到了“数据集”主题。我很困惑为什么我们需要数据集而不是在创建集成数据集时直接使用对数据文件的引用?
此外,链接服务和数据集之间有什么区别? 我们不能通过链接服务直接链接我们的数据吗?
最佳答案
链接服务
链接服务定义服务级别连接,包括任何所需的身份验证。例如 Azure SQL 数据库、存储帐户、SFTP 服务器等。因此,链接服务引用服务,而不是其中包含的数据。
链接服务可以被多次引用,并且所有数据集都需要链接服务引用。
数据集
数据集定义对链接服务中包含的资源/数据的运行时访问。例如 SQL 表、存储中的容器/文件夹/Blob、SFTP 中的文件等等。数据集类型将决定需要哪种类型的链接服务引用。
数据集非常灵活。他们可以直接指向特定资源,也可以定义参数,或这两种方法的组合。他们可以定义模式,也可以不定义模式。您需要配置一个数据集来满足您的特定需求。
重要的是要了解数据集没有/保存/包含数据。相反,它被特定事件[例如查找、复制、数据流等]用来访问数据。
所以简短的答案是您可以创建对数据的直接引用,但您可以通过数据集来完成。
关于Azure Synapse 数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/76887820/