java - 为什么 Java Stream 生成器是无序的?

标签 java java-stream

我尝试使用 Java Streams 并行化一些工作。让我们考虑这个简单的例子:

Stream.generate(new Supplier<Integer>() {
        @Override
        public Integer get() {
            return generateNewInteger();
        }
    })
    .parallel()
    .forEachOrdered(new Consumer<Integer>() {
        @Override
        public void accept(Integer integer) {
            System.out.println(integer);
        }
    });

问题是它不会为forEachOrdered 调用accept 方法,它只有在我使用forEach 时才有效。我想问题是 Stream.generate 在内部创建了 InfiniteSupplyingSpliterator ,它没有 ORDERED 特性。

问题是为什么?似乎我们知道数据生成的顺序。第二个问题是如何在生成流元素的并行流上执行forEachOrdered

最佳答案

最简单的答案是,Stream.generate 是无序的,因为 it’s specification这么说。

这并不是说如果实现尽可能按顺序处理项目,实际上恰恰相反。一旦一个操作被定义为无序的,只要有可能,实现就会尝试从无序的本质中获益。如果您在无序操作中遇到看起来像源顺序的事情,则可能没有办法从无序处理中获益,或者实现尚未使用所有机会。由于这可能会在未来版本或替代实现中发生变化,因此如果操作已指定为无序,则您不得依赖该顺序。

与有序的 Stream.iterate 相比,将 Stream.generate 定义为无序的意图可能会变得更加清晰。传递给 iterate 的函数将接收其前一个元素,因此元素之间存在前-后关系,因此是一种排序。通过 Stream.generate 的供应商没有收到前一个元素,换句话说,仅考虑功能签名时,与前一个元素没有关系。这适用于 Stream.generate(() -> constant)Stream.generate(Type::new) 之类的用例,但不适用于 Stream.generate (instance::statefulOp),这似乎不是预期的主要用例。如果操作是线程安全的并且您可以接受流的无序性质,它仍然有效。

你的例子一直没有进展的原因是 forEachOrdered 的实现实际上没有考虑无序性,而是尝试按照遇到顺序拆分后的 block 进行处理,即所有子-任务尝试缓冲它们的元素,以便一旦它们左侧的子任务完成,它们就可以将它们传递给操作。当然,缓冲和无限源不能一起很好地发挥作用,尤其是因为底层 InfiniteSupplyingSpliterator 将拆分为自己无限的子任务。原则上,有一个最左边的任务可以将其元素直接提供给操作,但该任务似乎在队列中的某个位置,等待被激活,这永远不会发生,因为所有工作线程都已经忙于处理另一个无限子-任务。最终,如果您让它运行足够长的时间,整个操作将因 OutOfMemoryError 而中断……

关于java - 为什么 Java Stream 生成器是无序的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42490328/

相关文章:

java - 连接两个 int[]

java - 如何告诉 EclipseLink 在 SQL 中使用完整的表名称作为别名

java - 有没有办法控制位深度=1(黑白)的 TIFF-PNG 转换中哪些像素变黑(阈值)

java - 在 Google App Engine 的 VFS 中编译 JSP 文件

Java Parallel Streams 关闭线程

java - 如何使用 Java 8 Stream 将 Array 转换为 HashMap

java - 碧 Jade 报告 : Getting JRRuntimeException: Error creating SAX parser

java - Android 多点触控 - TouchMove 事件中的 IllegalArgumentException

Java并行流产生HashMap

java - 在原始流上使用收集器