azure - Polybase 中的增量负载

标签 azure azure-sql-database azure-blob-storage azure-synapse polybase

我已为 PolyBase 创建了一个外部表,以将数据从 BLOB 存储加载到 Azure SQL 数据仓库。我有以下有关文件加载的问题。

1) 如果数据不断增长,那么 PolyBase 将如何工作。如果有像

这样的每日样本文件
test_2019_02_01.incr
test_2019_02_02.incr

那么我们每次都需要创建drop并重新创建外部表吗?如果不是,我该如何完成这项工作

CREATE EXTERNAL TABLE [dbo].[sample]
 (
 [social] varchar(30) NOT NULL,
 [address] varchar(30) NOT NULL
 )
 with (
 LOCATION='/TEST/',
 DATA_SOURCE=POLYTEST,
 FILE_FORMAT=POLY_TEST_HEADER,
 REJECT_TYPE=VALUE,
 REJECT_VALUE=0
 )

2) 我可以在 PolyBase Azure BLOB 存储中编写 UNIX 脚本吗?

请分享您对此问题的看法。

最佳答案

您可以在 Azure SQL 数据仓库上创建一个表,其中存储来自文件的数据,然后创建位于 Azure 存储上的文件列表,并迭代该列表,并为每个项目创建和删除外部表在名单上。您可以标记已处理的每个项目。每次创建外部表时,都会将数据加载到 Azure 数据仓库表中,然后删除外部表。 Here您会找到一个完整的示例。

关于azure - Polybase 中的增量负载,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54484816/

相关文章:

azure - 您可以将流量管理器与 blob 存储或 Azure 功能结合使用吗

azure - 使用 Postman 更新 azure 附加 blob 存储

azure - 如何通过 Azure API Manager 中的 Terraform 添加新的 API 版本?

visual-studio - 为什么 Azure Visual Studio Team Services VSTS 构建失败?

azure-sql-database - 如何在下一个任务中使用 SqlAzureDacpacDeployment@1 任务结果

sql-server - SQL Server 高可用性本地 - 云

c# - 如何使用输出参数实现azure异步函数

azure - GRANT 数据库范围凭据语法给出不匹配的输入错误

asp.net - 如何在一个 Azure Web App 上托管多个应用程序

azure-sql-database - 无法运行从 power bi 到 azure 的查询