r - 根据向量给出的 ID 从矩阵中提取多行

标签 r for-loop matrix vectorization

假设我们有一个矩阵 m有 3 列和一个向量 id带有行标识:

m <- matrix(c(1,1,2,1,2,3,2,2,2,3,3,4,6,7,7,
          2,2,2,4,4,5,8,9,9),ncol=3,byrow=T)

# m
#     [,1] [,2] [,3]
#[1,]    1    1    2
#[2,]    1    2    3
#[3,]    2    2    2
#[4,]    3    3    4
#[5,]    6    7    7
#[6,]    2    2    2
#[7,]    4    4    5
#[8,]    8    9    9

id <- c(1,2,3,4,5,1,4,5)

m 中提取行的最快方法是什么?与 id ?

因此,我想为 id 中的每个唯一标识符都有一个向量。 .就像是:
##[1] 1 1 2 2 2 2
##[2] 1 2 3
##[3] 2 2 2
##[4] 3 3 4 4 4 5
##[5] 6 7 7 8 9 9

我相当糟糕的解决方案对于我的目的来说太慢了:
pts_list <- list()
for (i in unique(id)){
  pts_list[[i]] <- as.vector(t(m[id==i,]))
}
pts_list

这里有一个测试速度的小脚本(这真的很难看......):
pts_list <- list()
m2 <- cbind(m,m,m,m)
m3 <- rbind(m2,m2,m2,m2,m2,m2,m2,m2,m2,m2)
m4 <- rbind(m3,m3,m3,m3,m3,m3,m3,m3,m3,m3)
m5 <- rbind(m4,m4,m4,m4,m4,m4,m4,m4,m4,m4)
m6 <- rbind(m5,m5,m5,m5,m5,m5,m5,m5,m5,m5)
id6 <- rep(1:8000,10)

system.time(
  for (i in unique(id6)){
    pts_list[[i]] <- as.vector(t(m6[id6==i,]))
  }
)

#   user  system elapsed 
#  8.094   1.524   9.617

有什么建议?

最佳答案

如果您不关心值顺序,您可以简单地做

split(m, id)
# $`1`
# [1] 1 2 1 2 2 2
# 
# $`2`
# [1] 1 2 3
# 
# $`3`
# [1] 2 2 2
# 
# $`4`
# [1] 3 4 3 4 4 5
# 
# $`5`
# [1] 6 8 7 9 7 9

如果您确实在意,可以将其与 lapply 结合使用
lapply(split(as.data.frame(m), id), function(x) c(t(x)))
# $`1`
# [1] 1 1 2 2 2 2
# 
# $`2`
# [1] 1 2 3
# 
# $`3`
# [1] 2 2 2
# 
# $`4`
# [1] 3 3 4 4 4 5
# 
# $`5`
# [1] 6 7 7 8 9 9

关于r - 根据向量给出的 ID 从矩阵中提取多行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32222806/

相关文章:

r - 如何用 RHS 上的矩阵项理解/扩展 r 公式

java - 返回 for 循环外部的 for 循环元素

javascript - 双让声明 : How does let hoisting work in for loops?

arrays - 在Matlab中将矩阵中的元素i,j设置为i^j

r - 使用 str_replace 有条件替换

r - 获取 RStudio Server 开源版本以使用替代 gcc 版本

C编程嵌套for循环打印半金字塔

matrix - 沿一个坐标轴的3D偏斜变换矩阵

matrix - 如何构造一个包含 9 个较小矩阵的矩阵

r - 在带有刻面的图形上添加 R^2