我需要将通过 Azure Data Lake Analytics (ADLA) 处理的多 TB 数据集导出到 SQL Server 数据库。
根据我迄今为止的研究,我知道我可以使用内置输出器将 (ADLA) 输出的结果写入 Data Lake 存储或 WASB,然后使用 Polybase 从 SQL Server 读取输出数据。
但是,将 ADLA 处理的结果创建为 ADLA 表对我们来说似乎非常有吸引力。它是一个干净的解决方案(无需管理文件)、多个读取器、内置分区、分发键以及允许其他进程访问表的潜力。
如果我们使用 ADLA 表,我可以通过 SQL Polybase 访问 ADLA 表吗?如果没有,是否有任何方法可以直接从 Polybase 访问 ADLA 表底层的文件?
我知道我可能可以使用 ADF 来完成此操作,但此时我想尽可能避免使用 ADF - 以最大限度地降低成本并保持流程简单。
最佳答案
不幸的是,Polybase 对 ADLA 表的支持仍在路线图上,尚未提供。请通过 SQL Data Warehouse User voice page 提交功能请求.
建议的解决方法是在 ADLA 中生成 Csv 信息,然后在 SQL DW 中创建分区和分布式表,并使用 Polybase 读取数据并填充 SQL DW 托管表。
关于sql - 从 SQL Server Polybase 访问 Azure Data Lake Analytics 表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49372998/