powershell - 导入表数据并使用databricks将其另存为json文档在adls gen2中

标签 powershell azure-databricks azure-data-lake-gen2

我正在使用以下代码从sql server表生成json结果集。
Powershell:

$InstanceName = "SQLTEST1\ENG_TST1"
$connectionString = "Server=$InstanceName;Database=dbadb;Integrated Security=True;"

$query = "SELECT * FROM dbo.sales"

$connection = New-Object System.Data.SqlClient.SqlConnection
$connection.ConnectionString = $connectionString

$connection.Open()
$command = $connection.CreateCommand()
$command.CommandText = $query

$result = $command.ExecuteReader()

$table = new-object "System.Data.DataTable"

$table.Load($result)

$table | select $table.Columns.ColumnName | ConvertTo-Json

$connection.Close()
您能否指导我使用Azure Databricks将json文档存储在Azure Data Lake Storage Gen2中。

最佳答案

您可以根据需要使用df.write.json API写入任何特定位置。
语法: df.write.json('location where you want to save the json file') 示例: df.write.json("abfss://<file_system>@<storage-account-name>.dfs.core.windows.net/iot_devices.json")以下是使用Azure Databricks将JSON文档保存到Azure Data Lake Gen2的步骤。
步骤1:您可以使用spark.read.json API读取json文件并创建一个数据框。
步骤2:可以使用以下文档中的说明将blob存储位置挂载到databricks dbfs目录中
https://docs.microsoft.com/en-us/azure/databricks/data/data-sources/azure/azure-datalake-gen2
步骤3:然后使用df.write.json API写入装载点,该装载点将写入Blob存储
有关更多详细信息,请参阅以下文章:
Azure Databricks – JSON files
样本笔记本: https://docs.microsoft.com/en-us/azure/databricks/_static/notebooks/adls-passthrough-gen2.html
enter image description here

关于powershell - 导入表数据并使用databricks将其另存为json文档在adls gen2中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63235137/

相关文章:

powershell - 替换讨厌的 'umlaut' |标准方式不起作用

keras - 无法在databricks中保存keras模型

azure - 将数据从 Azure SQL 托管实例导出到 Azure Data Lake Storage 作为 json

apache-spark - 如何从独立的 Spark 集群访问 azure block 文件系统 (abfss)

Powershell - 自定义模块的输出不可用

C# Runspace Powershell(交互式)

azure - 使用azure databricks读取azure databricks日志json文件

azure - Pyspark - 附加两个 json 结构

python - 如何将 .parquet 文件从本地计算机上传到 Azure Storage Data Lake Gen2?

PowerShell 和表达式中的空格