我们在 Azure 数据湖存储中拥有大小约为 100 GB 的 JSON 文件。我们需要将它们转换为 CSV 文件并保存到同一 Azure 数据湖存储中的不同文件夹中。有哪些可用选项?
最佳答案
为此,您有几种选择。这通常是一个简单的两步过程:提取和输出。
A. 您可以运行 ADLA/U-SQL 作业来执行此操作。这是 U-SQL 中 JSON 提取器的示例 https://github.com/Azure/usql/tree/master/Examples/DataFormats/Microsoft.Analytics.Samples.Formats
B. 另一种选择是创建 HDInsight 群集来转换数据。您可以使用您选择的任何应用程序。以下是某人在 PIG 中执行此操作的示例: https://acadgild.com/blog/converting-json-into-csv-using-pig/
关于Azure 数据湖存储 - 将 JSON 转换为 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42919745/