我正在尝试将功能应用于大型data.table中的一组列,而无需单独引用每个列。
a <- data.table(
a=as.character(rnorm(5)),
b=as.character(rnorm(5)),
c=as.character(rnorm(5)),
d=as.character(rnorm(5))
)
b <- c('a','b','c','d')
使用上面的MWE,这是:
a[,b=as.numeric(b),with=F]
可以,但是:
a[,b[2:3]:=data.table(as.numeric(b[2:3])),with=F]
不起作用。将
as.numeric
函数仅应用于a
的第2列和第3列而不单独引用它们的正确方法是什么。(在实际数据集中有数十列,因此不切实际)
最佳答案
惯用的方法是使用.SD
和.SDcols
您可以通过包装在()
中来强制在父框架中评估RHS
a[, (b) := lapply(.SD, as.numeric), .SDcols = b]
对于专栏2:3
a[, 2:3 := lapply(.SD, as.numeric), .SDcols = 2:3]
要么
mysubset <- 2:3
a[, (mysubset) := lapply(.SD, as.numeric), .SDcols = mysubset]
关于r - 通过列索引而不是名称将函数应用于data.table列的子集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16783598/