c# - 有没有一种简单的方法可以通过非交换操作进行并行聚合?

标签 c# linq parallel-processing aggregate

.NET Framework 使并行聚合变得容易,但根据 the documentation ,它仅适用于交换运算,即 f(x, y) = f( y, x):

The .NET implementation of the Parallel Aggregation pattern also expects the operations to be commutative.

我想使用连接来聚合字符串值,这是一种非交换操作。顺序方法如下所示:

var result = string.Concat(sequence.Select(this.LongOperation));

所以如果this.LongOperation依次返回HelloWorld!,最后的结果是HelloWorld!

如果我使用并行聚合,结果可能是 HelloWorld,也可能是 World!Hello!HelloWorld 等。

解决方法是执行类似于以下操作的操作:

var result = sequence
    .AsParallel()
    .Select((v, i) => new { Index = i, Value = v })
    .Select(c => new { Index = c.Index, Value = this.LongOperation(c.Value))
    .OrderBy(c => c.Index)
    .Aggregate(seed: string.Empty, func: (prev, current) => prev + current);

具有(不重要,在我的特定情况下)缺点,即整个序列将在 OrderBy 步骤进行评估,而无需等到聚合。另一种写法是:

var parts = sequence
    .AsParallel()
    .Select((v, i) => new { Index = i, Value = v })
    .Select(c => new { Index = c.Index, Value = this.LongOperation(c.Value))
    .OrderBy(c => c.Index)
    .Select(c => c.Value);

var result = string.Concat(parts);

我应该这样做,还是有更简单的方法来做这件事?

最佳答案

您正在寻找 ParallelEnumerable.AsOrdered :

var result = sequence
    .AsParallel()
    .AsOrdered()
    .Aggregate(seed: string.Empty, func: (prev, current) => prev + current);

您需要保留顺序这一事实将对您的查询产生性能影响。由于结果需要按顺序聚合,您将无法享受并行的最大好处,并且有时可能会导致顺序迭代的性能下降。话虽如此,这将满足您的需求。

例如,以下代码将始终生成 "[7][35][22][6][14]":

var result = new [] { 35, 14, 22, 6, 7 }
    .AsParallel()
    .AsOrdered()
    .Select(c => "[" + c + "]")
    .Aggregate(seed: string.Empty, func: (prev, current) => prev + current);

Console.WriteLine(result);

有一篇关于PLINQ Ordering的好帖子由并行编程团队编写。

关于c# - 有没有一种简单的方法可以通过非交换操作进行并行聚合?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32226737/

相关文章:

java - Java 会自动并行化递归函数吗?

c# - 防火墙后的 WCF 服务——如何设置端口转发?

c# - SQLCacheDependency 和 AppFabric 服务器

c# - 从 ASP.NET 网站 Webforms 调用 ASP.Net Web API

c# - 如何检查我的 List<string> 中的任何单词是否包含在文本中

c# - 如何将 XmlNode 转换为 XElement?

c# - 防止或禁止使用Parallel.ForEach

javascript - Angular 提示缺少一个根本没有声明的模块我

c# - LinQ 查询简单的 Where 子句和许多过滤条件

r - 我可以告诉R plyr软件包默认情况下并行工作吗?