我想捕获所有提到的“养老金”(不区分大小写,包括养老金、养老金领取者,但不包括“暂停”等不相关的词。但是,我想排除前面带有“工作部”的养老金)和 "; 但我无法捕获整个表达式。到目前为止我已经:
sentences <- c("department of work and pensions", "and pensioners", "pensioners", "Pensions", "suspension")
try <- grepl("(?<!department of work and )^pension*", ignore.case = T, perl = T, sentences)
try
有什么建议吗?
最佳答案
我们可能会使用
grepl("\\bpension\\S+", sentences, ignore.case = TRUE) &
!grepl("department of work .*\\bpension\\S+", sentences, ignore.case = TRUE)
关于r - grepl 排除模式之前的一组单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71800310/