apache-spark - 使用 Spark 读取 Azure Synapse 表

我正在寻找如何从 Scala Spark 读取 Azure Synapse 表，但没有成功。我在 https://learn.microsoft.com 中找到其他带有 Spark 的 Azure 数据库的连接器，但新的 Azure 数据仓库没有任何连接器。

有人知道这是否可行吗？

最佳答案

现在可以直接通过简单的工作(甚至在 UI 中为此添加了右键单击选项)从 Azure Synapse 中的专用 SQL 池中读取数据(用于 Scala 的新 Analytics 工作区，而不仅仅是 DWH)(不幸的是，目前只有 Scala)。

在 Synapse 工作区中(当然也有一个写入 API):

val df = spark.read.sqlanalytics("<DBName>.<Schema>.<TableName>")

如果在集成笔记本体验之外，需要添加导入:

 import com.microsoft.spark.sqlanalytics.utils.Constants
 import org.apache.spark.sql.SqlAnalyticsConnector._

听起来他们正在努力扩展到 SERVERLESS SQL 池以及其他 SDK(例如 Python)。

关于apache-spark - 使用 Spark 读取 Azure Synapse 表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60811094/