我正在尝试做某事但不记得/找到答案。我有一份来自人口普查局的城市名称列表,他们把城市的类型放在最后,这弄乱了我的 match()
.
我想做这个:
Middletown Township
Sunny Valley Borough
Hillside Village
进入这个:
Middletown
Sunny Valley
Hillside
有什么建议?理想情况下,我也想知道是否有
lastIndexOf()
R 中的函数。这是dput:
> dput(df1)
structure(list(id = c(1, 2, 3), city = structure(c(2L, 3L, 1L
), .Label = c("Hillside Village", "Middletown Township", "Sunny Valley Borough"
), class = "factor")), .Names = c("id", "city"), row.names = c(NA,
-3L), class = "data.frame")
最佳答案
这将起作用:
gsub("\\s*\\w*$", "", df1$city)
[1] "Middletown" "Sunny Valley" "Hillside"
它删除由一个或多个空格字符组成的任何子字符串,后跟任意数量的“单词”字符(空格、数字或下划线),后跟字符串的结尾。
关于R从字符串中删除最后一个单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13093931/