假设我们有两个数组:
DateTime[] wDates = new DateTime[20000];
double[] wValues = new double[20000];
这两个数组都是按顺序排序的,即给定一个 int i,wValues[i] 表示日期 wDates[i]。
假设我们需要获取 wValues 的平均值,其中日期月份为一月
使用标准循环,这将是:
double wAvg = 0.0;
int wDataCount = 0;
for (int i=0; i < 20000; i++)
if (wDates[i].Month == 1)
{
wAvg += wValues[i];
wDataCount++;
}
if (wDataCount > 0)
wAvg /= wDataCount;
我想知道如何在 LINQ 中执行此操作? 我可以创建一个包含这两个值的结构/类 DateDouble,然后执行以下操作:
List<DateDouble> wListData = new List<DateDouble>();
Add the items...
double wAvg = (from d in wListData
where d.Date.Month == 1
select d.Value).Average();
但是,如果每天创建数千万次,创建数千个 DateDouble 对象将是一个很大的内存开销。临时对象也会发生同样的情况,尝试使用“索引”并加入数组上的索引会产生糟糕的性能。
在 LINQ 中是否有更好的方法来实现这一目标?
谢谢, MM
最佳答案
那么,您可以使用 Zip
运算符使事情变得更简单:
var average = wDates.Zip(wValues, (date, value) => new { date, value })
.Where(pair => pair.date.Month == 1)
.Average(pair => pair.value);
这仍然会为每对创建一个匿名类型的实例,但我个人会放弃它并测量性能,然后假设它会太昂贵。请注意,这将以流式方式运行 - 因此尽管它会生成大量垃圾,但任何一次所需的总内存都很小。
您可以通过创建自己的结构对来提高效率...这将避免创建额外的对象,但这会更痛苦。不过,还不错:
// The normal Tuple types are classes.
public struct TupleValue<T1, T2>
{
private readonly T1 item1;
private readonly T2 item2;
public T1 Item1 { get { return item1; } }
public T2 Item2 { get { return item2; } }
public TupleValue(T1 item1, T2 item2)
{
this.item1 = item1;
this.item2 = item2;
}
}
var average = wDates.Zip(wValues, (date, value) =>
new TupleValue<DateTime, double>(date, value))
.Where(pair => pair.Item1.Month == 1)
.Average(pair => pair.Item2);
我只会在证明第一种方法成本高昂之后才会这样做。
关于arrays - LINQ - 根据数组 B 上的值从数组 A 中选择元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10639314/