流处理中 5 秒的滚动窗口与微批处理时 5 秒的微批处理有何不同?两者都有一个 5 秒的非重叠窗口,在此期间它们处理记录然后继续。
我知道流处理中有这个时间概念:事件、摄取和处理时间。我们可以推断使用微批处理的流处理只不过是使用带有摄取时间或处理时间的滚动窗口的流处理吗?
最佳答案
经过更多的研究,这是我的结论
因此,作为黑盒的微批处理与滚动窗口非常相似,但真正的区别在于用于实现窗口处理的底层架构/设计/方法。
来源:
关于apache-spark - 流媒体 : tumbling window vs microbatching,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55933494/