azure - Azure Data Lake 中的文件夹统计信息

标签 azure analytics azure-data-lake u-sql

我正在尝试总结已将多少数据写入数据湖中的文件夹中。做这个的最好方式是什么?我应该使用 U-SQL 作业吗? HDInsights?

最佳答案

有两种方法可以做到这一点:

  1. 如果是一次性操作,您可以使用 Azure 存储资源管理器 ( https://azure.microsoft.com/en-us/features/storage-explorer/ ),导航到 Data Lake Store 文件夹并获取其大小。
  2. 如果您想要以编程方式执行此操作,Data Lake Store 提供了一个符合 WebHDFS 的 API,它可以列出多个文件夹属性:GETCONTENTSUMMARY。您可以在这里查看更多详细信息:https://learn.microsoft.com/en-us/rest/api/datalakestore/webhdfs-filesystem-apis .

希望这有帮助

何塞

关于azure - Azure Data Lake 中的文件夹统计信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49179754/

相关文章:

azure - 计算 Azure 事件中心中每秒传入的字节数

ios - 崩溃超过特定阈值时的电子邮件警报

analytics - 如何在 mixpanel 中正确使用 distinct_id

Azure Data Lake 服务主体使用数据工厂编写

azure - 通过 LOCATION 语句从 EXTERNAL 中选择

python - 将原始二进制图像传递到 Azure 认知服务 API

c# - 使用 Visual Studio 2019 在本地调试 Azure Function

azure - 动态数据集中的动态文件格式

php - NodeJS crypto.createHmac SHA256 无法正常工作

iphone - iPhone/iOS 平台可用的分析服务/库?