java - Hazelcast Jet 丢弃空聚合结果

标签 java hazelcast hazelcast-jet

我有一个可能有空结果的滑动窗口和自定义聚合累加器。什么是丢弃此类“空”聚合累加器以免进入接收器的正确方法?

        Pipeline pipeline = Pipeline.create();
        pipeline.drawFrom(Sources.<Long, Foo>map("map"))
                .map(Map.Entry::getValue)
                .addTimestamps(Foo::getTimeMillisecond, LIMIT)
                .window(WindowDefinition.sliding(100, 10))
                .aggregate(FooAggregateOperations.aggregateFoo(), (s, e, r) -> {
                    return String.format("started: %s\n%s\nended: %s\n", s, r, e);
                })
                .drainTo(Sinks.files(sinkDirectory));

如您所见,聚合器返回字符串:

public class FooAggregateOperations {

    public static AggregateOperation1<Foo, FooAccumulator, String> aggregateFoo() {
        return AggregateOperation
                .withCreate(FooAccumulator::new)
                .andAccumulate(FooAggregateOperations::accumulate)
                .andCombine(FooAggregateOperations::combine)
                .andDeduct(FooAggregateOperations::deduct)
                .andFinish(FooAccumulator::getResult);
    }
}

问题基本上是,在继续与其他结果合并/扣除或冲入接收器之前,如何丢弃可忽略的窗口/聚合结果?

最佳答案

要过滤掉空的聚合结果,您可以使用以下方法:

    Pipeline pipeline = Pipeline.create();
    pipeline.drawFrom(Sources.<Long, Foo>map("map"))
            .map(Map.Entry::getValue)
            .addTimestamps(Foo::getTimeMillisecond, LIMIT)
            .window(WindowDefinition.sliding(100, 10))
            .aggregate(FooAggregateOperations.aggregateFoo(),
                    (s, e, r) -> tuple3(s, e, r))
            .filter(t -> !isEmpty(t.f2()))
            .map(t -> String.format("started: %s\n%s\nended: %s\n", t.f0(), t.f2(), t.f1()))
            .drainTo(Sinks.files("sinkDirectory"));

它所做的是将聚合结果存储在一个临时元组中,然后应用过滤和最终映射。

我还创建了一个 issue on GitHub我们将考虑在聚合操作中支持这种行为。

关于java - Hazelcast Jet 丢弃空聚合结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50013276/

相关文章:

java - Hazelcast SQL 接口(interface)性能缓慢 HZ 4.2.2 与 HZ 5.0.2

java - Hazelcast keySet 流媒体?

java - 如何让简单的 DAG 在 Hazelcast Jet 中工作?

java - Spring MVC : Get Unnamed Request Parameter

java - 使用Hibernate保存失败

docker - Hazelcast 成员在 2 个不同的 docker 主机中

key hazelcast 上的正则表达式

mongodb - 在 tomcat 容器中运行 Hazelcast 客户端

java - JPA2 - 使用 Criteria API 作为动态查询递归获取连接实体的子实体

java - Oracle Apex“保存”按钮不可见