我试图将日期从两种格式强制转换为一种我可以轻松输入 as.Date
的格式。 .这是一个示例:
library(dplyr)
df <- data_frame(date = c("Mar 29 2017 9:30AM", "5/4/2016"))
我试过这个:
df %>%
mutate(date = gsub("([A-z]{3}) (\\d{2}) (\\d{4}).*",
paste0(which(month.abb == "\\1"),"/\\2","/\\3"), date))
但它给了我这个:
date
1 /29/2017
2 5/4/2016
但我想要这个!
date
1 3/29/2017
2 5/4/2016
看起来像当我使用
month.abb == "\\1"
时,它不使用捕获组输出( "Mar"
),它只使用调用者文本( "\\1"
)。如果可能,我想在正则表达式中执行此操作。我知道你可以用另一种方式来做,但想要变得圆滑。有任何想法吗?
最佳答案
这是 gsubfn
的一种方式
library(gsubfn)
df$date <- gsubfn("^([A-Za-z]{3})\\s+(\\d{2})\\s+(\\d{4}).*", function(x, y, z)
paste(match(x, month.abb),y, z, sep="/"), df$date)
df$date
#[1] "3/29/2017" "5/4/2016"
或
sub
结合 gsubfn
sub("(\\S+)\\s+(\\S+)\\s+(\\S+).*", "\\1/\\2/\\3",
gsubfn("^([A-z]{3})", setNames(as.list(1:12), month.abb), df$date))
#[1] "3/29/2017" "5/4/2016"
关于r - 在 R 中处理日期正则表达式捕获组输出,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43621499/