我是 C#、Parallel.ForEach
和 .NET 的新手。我想并行化涉及数千个位置的搜索。对于每个位置,我计算大圆距离。那是我想传播到不同核心的计算。我的问题是,如果我只有一个 线程局部变量,我该怎么做,如 MSDN TPL example ?对于结果,我查看了Interlocked
,并看到了它的选项Add
、CompareExchange
、Decrement
、 Exchange
、Increment
和 Read
,但我不只是添加、递增、递减或测试相等性。我想通过多个并行运行的线程返回具有最短 overall 距离的对象。我的直觉告诉我这应该很容易,我应该能够创建一些包含 Location
和距离的小对象,但是我如何从每个线程中捕获最佳答案,然后 选择其中最短的距离?这是非并行版本:
Location findClosestLocation(Location myLocation, List<Location> allLocations)
{
double closest = double.MaxValue;
Location closestLoc = null;
foreach (Location aLoc in allLocations)
{
if (aLoc != myLocation)
{
double d = greatCircle(myLocation, aLoc);
if (d < closest)
{
closest = d;
closestLoc = aLoc;
}
}
}
return closestLoc;
}
我确实看到了 DDJ Blog Post这似乎提供了很好的建议,但我想知道这是否是最好的建议。我看到作者在数组上循环,想知道是否有更实用的方法来做到这一点。在函数式世界中,我会使用 map
、lambda
和 min
。
最佳答案
这里最简单的选择是切换到 PLINQ:
Location findClosestLocation(Location myLocation, List<Location> allLocations)
{
return allLocations
.AsParallel()
.Min(location => greatCircle(myLocation, location));
}
也就是说,这基本上只是 aggregation with parallel constructs .如果你想坚持使用 Parallel 类,你有几个选择。一种选择是使用锁定在 block 中自己同步它。我不推荐这样做,因为它会损害您的整体表现。
更好的选择是使用 Parallel.ForEach提供本地状态的方法。他们将允许您将其重写为:
Location findClosestLocation(Location myLocation, List<Location> allLocations)
{
double closest = double.MaxValue;
Location closestLoc = null;
object sync = new object();
Parallel.ForEach<Location, Tuple<double,Location>(
allLocations,
() => new Tuple(double.MaxValue, null),
(location, loopState, localState) =>
{
double d = greatCircle(myLocation, aLoc);
if (d < localState.Item1)
return new Tuple(d, aLoc);
else
return localState;
},
localState =>
{
lock(sync)
{
if (localState.Item1 < closest)
{
closest = localState.Item1;
closestLoc = localState.Item2;
}
}
}
);
return closestLoc;
}
我涵盖使用 local state for aggregations in detail on my blog .这基本上将操作更改为每个线程一个锁操作,而不是每个处理元素一个锁,因此您可以获得比简单的锁定解决方案更高的吞吐量。
关于c# - 使用 Parallel.ForEach 在最小值中选择最小值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3322794/