r - 优化下采样的代码

标签 r for-loop downsampling

我有一个这样的表,它是 flyTracesFiltered。

     Time    Right     Left
1 0.000000000 18.21980 30.98789
2 0.009222031 22.15157 37.18590
3 0.022511959 25.63218 42.49231
4 0.029854059 28.43851 46.57811
5 0.039320946 30.43885 49.29414
6 0.052499056 31.60561 50.67852

我想做的是按时间降采样。也就是说,我想平均某个时间段内的所有值以减少样本数。就我而言,我使用的是 0.05 秒平均值 (20Hz) 的平均值。我做的功能是这样的:
flyDataDownsampleTime <- function(flyTracesFiltered, samplePeriod) {

  AvgRight<-NULL
  FlyDataRight<-NULL
  AvgLeftt<-NULL
  FlyDataLeft<-NULL
  AvgTime<-NULL
  FlyDataTime<-NULL


  for (i in seq(0,ceiling(max(flyTracesFiltered$Time)),samplePeriod)){

  AvgRight <-mean(flyTracesFiltered$Right[flyTracesFiltered$Time>=i & flyTracesFiltered$Time <= (i+samplePeriod)])  
  FlyDataRight<-c(FlyDataRight,AvgRight)

  AvgLeft <-mean(flyTracesFiltered$Left[flyTracesFiltered$Time>=i & flyTracesFiltered$Time <= (i+samplePeriod)])  
  FlyDataLeft<-c(FlyDataLeft,AvgLeft)

  AvgTime <-mean(flyTracesFiltered$Time[flyTracesFiltered$Time>=i & flyTracesFiltered$Time <= (i+samplePeriod)])  
  FlyDataTime<-c(FlyDataTime,AvgTime)
}
flyTracesDownTime <- data.frame("Time" = FlyDataTime, "Right" = FlyDataRight, "Left" = FlyDataLeft)

return(flyTracesDownTime)
}

我想问一下是否有办法改进这一点,因为大型数据帧需要很长时间。当我需要像这种情况下这样的迭代时(因为索引),我在实现应用系列函数时遇到了问题。我还阅读了 Vectorize 函数,但我不知道这是否可以使代码更有效。有什么建议?

最佳答案

您可以创建一个新字段,例如 group_num

flyTracesFiltered$group_num <- floor(flyTracesFiltered$Time/0.05)

其中 0.05 周期是您想要将样本缩短到的时间空间。在该字段上聚合,例如-
flyTracesFiltered2 = aggregate(flyTracesFiltered$Right,
                     list(group_num=flyTracesFiltered$group_num), mean)

这将为您提供一个新的数据框,其中每个 group_num 的平均值。

您可以对其他列(左)执行相同操作并合并数据框或仅添加新列。

关于r - 优化下采样的代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34156665/

相关文章:

python - 我的for循环与yield相结合的问题

r - 在 R 包中添加引用信息

R 中的重复模式(整数向下和向上)

python - 当 xpath = 没有这样的元素时停止循环

javascript - 使用数组和 for 循环获取

algorithm - 感知图像下采样

machine-learning - 缩减文本文档采样

R data.table 条件在组内,但在组中的第一个实例中记录

r - 在 R 中拆分数据框时删除列