假设我有一个由元组组成的数据流 (t, q)
其中 t
是感兴趣的变量。
是否有一种分布式方式来跟踪具有最大 t
的元组?仅在 t
高于全局最大值时发出?
最佳答案
你考虑过Flink的状态特性吗? ( https://ci.apache.org/projects/flink/flink-docs-release-1.0/apis/streaming/state.html )
我自己对 Flink 很陌生,但我认为它提供了您正在寻找的功能。
关于hadoop - Apache Flink - 跟踪最大值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38643472/