r - 通过采用 2x2 空间平均值将 data.frame 从 8x8 缩小到 4x4

<分区>

假设我有以下数据框，其中每个观察值代表二维空间中特定点的给定变量:

data = data.frame(col1 = c(1,2,3,4,5,6,7,8), col2 = c(2,3,'NA',5,6,7,8,9), col3 = c(3,4,5,6,7,8,9,10), col4 = c(2,3,4,1,2,6,7,8),
                  col5 = c(2,3,'NA','NA',6,7,8,9), col6 = c(1,2,3,5,6,7,8,9), col7 = c(1,2,3,4,6,7,'NA','NA'), col8 = c(1,2,3,4,5,6,'NA','NA'))

> print(data)
  col1 col2 col3 col4 col5 col6 col7 col8
1    1    2    3    2    2    1    1    1
2    2    3    4    3    3    2    2    2
3    3   NA    5    4   NA    3    3    3
4    4    5    6    1   NA    5    4    4
5    5    6    7    2    6    6    6    5
6    6    7    8    6    7    7    7    6
7    7    8    9    7    8    8   NA   NA
8    8    9   10    8    9    9   NA   NA

数据框是 8x8(8 列和 8 行)，因此总共有 36 个观察点。

我需要通过计算每个 2x2 观察组的平均值将其缩小为 4x4 数据框。

2x2 NA 组应返回 NA 值，而如果在 2x2 组中存在 < 4 个 NA，则平均值必须排除它们，例如2,2,2,NA = 2 的平均值。

这里是我想要的输出:

newcol1  newcol2  newcol3  newcol4
   2        3        2       1.50
   4        4        4       3.50
   6       5.75     6.50      6
   8       8.50     8.50      NA

我认为我可以用 for 循环解决这个问题，这是我尝试但没有成功的方法:

a = 1
b = 2

for (i in 1:15) {
      test[[i]] = mean(c(data[a,a], data[a,b], data[b,a], data[b,b]))
      test[[i]] = mean(c(data[a+i,a+i], data[a+i,b+i], data[b+i,a+i], data[b+i,b+i]))
}

我在网上搜索了很多，但找不到任何类似的问题或解决方案。

有什么建议吗？

有没有可以做这种空间分析的R包？

最佳答案

来自链接的帖子，使用 @flodel answer ，将 sum 替换为 mean:

a <- as.matrix(data)

#convert matrix from char to num, ignore warnings, they are due to NAs
class(a) <- "numeric" 

#adapted from @flodel https://stackoverflow.com/a/16884987/680068
res <- tapply(a, list((row(a) + 1L) %/% 2L, (col(a) + 1L) %/% 2L), mean, na.rm = TRUE)

# remove NANs
res[ is.nan(res) ] <- NA
res
#   1    2   3   4
# 1 2 3.00 2.0 1.5
# 2 4 4.00 4.0 3.5
# 3 6 5.75 6.5 6.0
# 4 8 8.50 8.5  NA

关于r - 通过采用 2x2 空间平均值将 data.frame 从 8x8 缩小到 4x4，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47473255/

上一篇：symfony - 检查 prod env 中的学说设置

下一篇：c - 指针解引用运算符 - 语法规则

相关文章：

regex - 删除 R 中欧元符号后的字符

r - 使用二进制值格式化 data.frame

node.js - 提供 CSS 样式表，通过 Node.js 中的链接标签链接到 HTML 文件，无需框架

r - 计算均值，包括除一个以外的所有因子水平

R auto.arima 错误

删除ggplot2中geom_boxplot中的边框

r - 在 SparkR 中删除 DataFrame 的列

python - 如何在 Pandas 中复制行？

python - 对 DF 中的多个系列应用 .isin

MEAN.JS : How to create of 1 model that requires another