如何在Spark Streaming中获取当前批处理时间戳(DStream)?
我有一个 Spark Streaming 应用程序,其中输入数据将进行多次转换。
我需要执行期间的当前时间戳来验证输入数据中的时间戳。
如果我与当前时间进行比较,那么时间戳可能与每个 RDD 转换执行不同。
有什么方法可以获取时间戳,特定的 Spark 流式微批何时开始或它属于哪个微批间隔?
最佳答案
dstream.foreachRDD((rdd, time)=> {
// time is scheduler time for the batch job.it's interval was your window/slide length.
})
关于java - 如何在 Spark Streaming 中获取当前批处理时间戳,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34437359/