数据集标记
X <- c("vijay","raj","joy")
Y <- c("maths","eng","science","social","hindi","physical","sanskrit")
df <- list()
for (i in X){
for (j in Y)
{
df <- data.frame(subset(marks, name == i & subject == j))
}
}
在这里,我想创建子集,其中包含针对每个学生的所有科目的分数。因此我们希望有 3 X 7 个子集。 但是我写的代码给了我一个子集。如何解决问题?
最佳答案
您可以使用 outer()
但您必须向量化内部函数:
X <- c("vijay","raj","joy")
Y <- c("maths","eng","science","social","hindi","physical","sanskrit")
set.seed(24)
marks <- data.frame(name = sample(X, 100, replace = TRUE),
subject = sample(Y, 100, replace = TRUE), stringsAsFactors = FALSE)
sset <- function(x,y) subset(marks, name == x & subject == y)
L <- outer(X, Y, FUN=Vectorize(sset, SIMPLIFY=FALSE))
L[1,1]
对象 L
是一个数据帧矩阵。
这是另一个使用双 lapply()
的解决方案:
L2 <- lapply(X, function(x) lapply(Y, function(y) subset(marks, name == x & subject == y)))
对象 L2
是列表的列表。
这是带有 for 循环的变体:
df <- vector("list", length(X)*length(Y))
l <- 1
for (i in X) for (j in Y) {
df[[l]] <- subset(marks, name == i & subject == j)
l <- l+1
}
对于仅对现有级别进行子集化,您可以简单地使用 split()
L3 <- split(marks, list(marks$name, marks$subject))
对象 L3
是一个数据帧列表。
关于r - 如何使用嵌套 for 循环创建多个数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50481979/