Azure 数据湖存储 - 将 JSON 转换为 CSV

标签 azure azure-data-lake

我们在 Azure 数据湖存储中拥有大小约为 100 GB 的 JSON 文件。我们需要将它们转换为 CSV 文件并保存到同一 Azure 数据湖存储中的不同文件夹中。有哪些可用选项?

最佳答案

为此,您有几种选择。这通常是一个简单的两步过程:提取和输出。

A. 您可以运行 ADLA/U-SQL 作业来执行此操作。这是 U-SQL 中 JSON 提取器的示例 https://github.com/Azure/usql/tree/master/Examples/DataFormats/Microsoft.Analytics.Samples.Formats

B. 另一种选择是创建 HDInsight 群集来转换数据。您可以使用您选择的任何应用程序。以下是某人在 PIG 中执行此操作的示例: https://acadgild.com/blog/converting-json-into-csv-using-pig/

关于Azure 数据湖存储 - 将 JSON 转换为 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42919745/

相关文章:

azure - 将单独的应用程序服务托管为网站目录

.net - Microsoft.Azure.Management.DataLake.Store 与 Microsoft.Azure.DataLake.Store

python - Azure 数据湖引发错误 - 确保授权 header 的值格式正确,包括签名

scala - Spark on HDInsights - 方案 : adl 没有文件系统

java - Play 2 : How to deploy dist app to the Windows Azure Cloud Services (not VM)

azure - ADWtest 需要访问组织中只有管理员才能授予的资源的权限

angularjs - 从Azure token 解析用户组信息?

azure - 创建的 AKS 群集没有外部 IP 地址

python - 通过 Azure 数据工厂将数据复制到 Azure 数据湖之前进行文件检查

azure - 如何使用 Azure Data Lake Storage Gen2 和 Azure Data Factory V2 执行基于事件的数据引入?