我正在尝试总结已将多少数据写入数据湖中的文件夹中。做这个的最好方式是什么?我应该使用 U-SQL 作业吗? HDInsights?
最佳答案
有两种方法可以做到这一点:
- 如果是一次性操作,您可以使用 Azure 存储资源管理器 ( https://azure.microsoft.com/en-us/features/storage-explorer/ ),导航到 Data Lake Store 文件夹并获取其大小。
- 如果您想要以编程方式执行此操作,Data Lake Store 提供了一个符合 WebHDFS 的 API,它可以列出多个文件夹属性:GETCONTENTSUMMARY。您可以在这里查看更多详细信息:https://learn.microsoft.com/en-us/rest/api/datalakestore/webhdfs-filesystem-apis .
希望这有帮助
何塞
关于azure - Azure Data Lake 中的文件夹统计信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49179754/