我有许多行数不等的文件。
一个文件的数据如下所示:
Height Temp
1014.0 22.4
992.0 23
850.0 15.2
557.0 -6.1
407.0 -17.1
314.0 -29.5
200 -51.9
如果值在以下间隔内,我想取平均值。
1000-925
925-850
850-700
700-600
600-500
500-400
400-300
300-200
200-100
100-0
我必须对具有不同高度值的多个文件执行此操作。
关于如何在 R 中正确执行此操作有什么建议吗? 我将不胜感激任何帮助。
最佳答案
您可以使用 cut
对高度进行分组,然后按组进行汇总:
library(dplyr)
mutate(df, category = cut(Height, c(seq(0, 700, 100), 850, 925, 1000, Inf))) %>%
group_by(category) %>%
summarise(average_height = mean(Height, na.rm = TRUE))
# A tibble: 7 x 2
category average_height
<fct> <dbl>
1 (100,200] 200
2 (300,400] 314
3 (400,500] 407
4 (500,600] 557
5 (700,850] 850
6 (925,1e+03] 992
7 (1e+03,Inf] 1014
关于r - R中间隔不均匀的多个文件的分箱,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59676075/