scala - Apache Flink 上的 zipWithIndex

标签 scala apache-flink

我想为我的输入的每一行分配一个 id - 这应该是来自 0 的数字至 N - 1 ,其中 N是输入中的行数。

粗略地说,我希望能够执行以下操作:

val data = sc.textFile(textFilePath, numPartitions)
val rdd = data.map(line => process(line))
val rddMatrixLike = rdd.zipWithIndex.map { case (v, idx) => someStuffWithIndex(idx, v) }

但是在 Apache Flink 中。是否可以?

最佳答案

这现在是 Apache Flink 0.10-SNAPSHOT 版本的一部分。 zipWithIndex(in) 的示例和 zipWithUniqueId(in)可在官方Flink documentation .

关于scala - Apache Flink 上的 zipWithIndex,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30596556/

相关文章:

apache-flink - Flink 在没有窗口的情况下减少键控流

scala - 使用种类投影仪在 Scala 中部分应用类型 lambda

scala - 过滤和映射包含选项的 scala 元组序列的简洁方法

java - 非法的反射访问操作会阻止程序运行吗?

real-time - Apache 弗林克 : Multiple Window Aggregations and Late Data

apache-flink - Flink 输出可以汇入 NFS 或 GPFS 文件系统吗?

java - Flink - 构建作业以最大化吞吐量

scala - 如何在spray-json中表示可选字段?

java - 在 Scala 中执行多线程的推荐方法是什么

Scala vals 可以修改