azure - 使用 Azure 表存储的 Databricks Scala 应用程序出现错误

标签 azure databricks azure-databricks

首先感谢您抽出时间回答下一个问题:)

我正在尝试将 Databricks Scala 应用程序与 Azure 表存储连接,但出现以下错误:

Azure 表 Scala APP

Error:

NoSuchMethodError: reactor.netty.http.client.HttpClient.resolver(Lio/netty/resolver/AddressResolverGroup;)Lreactor/netty/transport/ClientTransport;

at com.azure.core.http.netty.NettyAsyncHttpClientBuilder.build(NettyAsyncHttpClientBuilder.java:94) at com.azure.core.http.netty.NettyAsyncHttpClientProvider.createInstance(NettyAsyncHttpClientProvider.java:18) at com.azure.core.implementation.http.HttpClientProviders.createInstance(HttpClientProviders.java:58) at com.azure.core.http.HttpClient.createDefault(HttpClient.java:50) at com.azure.core.http.HttpClient.createDefault(HttpClient.java:40) at com.azure.core.http.HttpPipelineBuilder.build(HttpPipelineBuilder.java:62) at com.azure.data.tables.BuilderHelper.buildPipeline(BuilderHelper.java:122) at com.azure.data.tables.TableServiceClientBuilder.buildAsyncClient(TableServiceClientBuilder.java:161) at com.azure.data.tables.TableServiceClientBuilder.buildClient(TableServiceClientBuilder.java:93)

我附上代码:

val clientCredential: ClientSecretCredential  = new ClientSecretCredentialBuilder()
.tenantId(tenantID)
.clientId(client_san_Id)
.clientSecret(client_san_Secret)
.build()


val tableService = new TableServiceClientBuilder()
.endpoint("https://<Resource-Table>.table.core.windows.net")
.credential(clientCredential)
.buildClient()

非常感谢您抽出时间!

最佳答案

首先,您需要在 Azure databricks 上安装存储。

然后使用下面的代码来挂载表存储。

dbutils.fs.mount(
  source = "wasbs://<container-name>@<storage-account-name>.blob.core.windows.net/<directory-name>",
  mountPoint = "/mnt/<mount-name>",
  extraConfigs = Map("<conf-key>" -> dbutils.secrets.get(scope = "<scope-name>", key = "<key-name>")))

使用以下代码访问表存储:

// scala
val df = spark.read.text("/mnt/<mount-name>/...")
val df = spark.read.text("dbfs:/<mount-name>/...")

可以引用这个notebook

另请参阅此 article作者:高里·马哈詹

关于azure - 使用 Azure 表存储的 Databricks Scala 应用程序出现错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71485239/

相关文章:

postgresql - Azure Databrick 平台上的 pyspark 中的 Py4JJava 错误

python - 使用 Databricks 将 Google Api 的结果写入数据湖

pyspark - Databricks PySpark 作业不断被取消

Azure Databricks 执行失败 - CLOUD_PROVIDER_LAUNCH_FAILURE

azure - Azure 机器学习端点的 API key

azure - 在 Kudu 中找不到 Azure webjob 的 App.config

azure - 有没有办法在 PowerShell 替换脚本中替换 YAML 变量?

sql-server - 从 Azure Web 应用程序(通过 Azure S2S VPN)查询本地 SQL Server 失败

azure - 如何从 Azure databricks 在 Azure Blob 中创建空文件夹

azure - 在 Azure databricks 中创建外部表