analytics - 如何从Azure数据湖分析文件(txt和CSV等文件)中获取记录计数

标签 analytics azure-data-lake

adl://rs06ipadl01.azuredatalakestore.net/FIA/RDS/old/BANNER/2018/06/15/old_Banner.csv

我需要从上面的文件中获取记录。

最佳答案

您可以使用.Csv.Text等内置提取器来获取文件内容,然后使用COUNT来统计记录数。一个简单的例子:

DECLARE @inputFile string = @"input/input124.csv";
DECLARE @outputFile string = @"output/output.csv";

// Get the file
@input =
    EXTRACT col1 string,
            col2 string,
            col3 int
    FROM @inputFile
    USING Extractors.Csv( skipFirstNRows:1 );     // skip header row if you have one


// Count the records
@output = SELECT COUNT(*) AS records FROM @input;


// Output the result
OUTPUT @output
TO @outputFile
USING Outputters.Csv(quoting:false);

关于analytics - 如何从Azure数据湖分析文件(txt和CSV等文件)中获取记录计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50999796/

相关文章:

javascript - Google Analytics 链接帐户无法正常工作

analytics - Power BI Desktop 导入数据限制

Azure Datalake Gen2 作为 Azure 数据资源管理器的外部表

azure - 如何在 Azure 数据工厂中以 Salesforce 作为源创建增量负载?

azure - Visual Studio 更新后仅本地 ADLA 帐户可用

azure - 如何在Azure Data Lake存储上预处理和解压缩.gz文件?

google-play - 如何在 App Store URL 中跟踪 UTM 标签

analytics - 无法将类 ""missForest""强制转换为 data.frame 后,无法获取估算的数据帧

mysql - 分析mysql数据

azure - 如何重命名 Azure Data Lake Storage Gen1 帐户名称?