我有一个首字母变量,名称错误地分散在整个列表中。请参阅下面的示例结构:
ID <- c('SPW', 'SM', 'DLS', 'SJ', 'joe.schmoe', 'CEJ', 'teddy.roos', 'GVF', 'MJC',
'LH', 'sally.fields') ## Full names shouldn't be there -- only initials.
test <- data.frame(ID)
我想创建一个新变量 (ID2),它切换出任何带有指定首字母的名称。否则,我希望 ID2 包含来自 ID 的首字母。我目前不成功的代码的一个例子有望说明:
swfun <- function(x) {
switch(x,
'joe.schmoe' = 'JS',
'teddy.roos' = 'TR',
'sally.fields' = 'SF',
as.character(test$ID)
)
} ## In other words, I've created a switch function to replace any names
## with requisite initials. I was 'hoping' that the last command
## [as.character(test$ID)] would populate the rest of ID2 with values
## from test$ID.
test$ID2 <- sapply(test$ID, swfun)
而不是得到
test$ID2 <- c('SPW', 'SM', 'DLS', 'SJ', 'JS', 'CEJ', 'TR', 'GVF', 'MJC', 'LH', 'SF')
,我收到
test$ID2 <- list(NULL, NULL, "TR", NULL, c("SPW", "SM", "DLS", "SJ", "joe.schmoe", "CEJ", "teddy.roos", "GVF", "MJC", "LH", "sally.fields"), "JS",
NULL, "SF", NULL, NULL, NULL)
这个问题类似于我之前问过的问题 ( R: ifelse on string ),但是增加了用前一列的值填充列的其余部分的变化。此外,我想使用
switch
来解决这个问题。因为我对该功能还很陌生。
最佳答案
只需将 switch 函数中的最后一行切换为使用 x
而不是 test$ID
swfun <- function(x) {
switch(x,
'joe.schmoe' = 'JS',
'teddy.roos' = 'TR',
'sally.fields' = 'SF',
as.character(x)
)
}
结果
> unname(sapply(ID, swfun))
[1] "SPW" "SM" "DLS" "SJ" "JS" "CEJ" "TR" "GVF" "MJC"
[10] "LH" "SF"
编辑重新矢量化(弗兰克):如果您发现自己
sapply
经常这样做,你可能会考虑swfun2 <- Vectorize(swfun)
unname(swfun2(ID))
[1] "SPW" "SM" "DLS" "SJ" "JS" "CEJ" "TR" "GVF" "MJC"
[10] "LH" "SF"
或以下评论中链接的替代方案。
关于r - 列值的切换功能,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18950809/