regex - "opposite"结果的正则表达式

取以下字符向量x

x <- c("1     Date in the form", "2     Number of game", 
       "3     Day of week", "4-5     Visiting team and league")

我想要的结果是以下向量，其中每个字符串中的第一个大写单词，并且如果字符串包含 - ，也是最后一句话。

[1] "Date"     "Number"   "Day"      "Visiting" "league"

所以而不是这样做

unlist(sapply(strsplit(x, "[[:blank:]]+|, "), function(y){
   if(grepl("[-]", y[1])) c(y[2], tail(y,1)) else y[2] 
}))

为了得到结果，我想我可以尝试将其缩短为正则表达式。结果几乎与 sub 中的这个正则表达式“相反” 。我已经尝试了各种方法来获得相反的结果，使用不同品种的[^A-Za-z]+等等，但尚未成功。

> sub("[A-Z][a-z]+", "", x)
[1] "1      in the form"       "2      of game"           
[3] "3      of week"           "4-5      team and league"

所以我想这是一个由两部分组成的问题。

最佳答案

以下是一些建议:

要使用 sub 提取第一个大写单词，您可以使用

sub(".*\\b([A-Z].*?)\\b.*", "\\1", x)
#[1] "Date"     "Number"   "Day"      "Visiting"

其中 \\b 表示单词边界。

关于regex - "opposite"结果的正则表达式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24670038/