R从字符串中删除最后一个单词

标签 r regex string

我正在尝试做某事但不记得/找到答案。我有一份来自人口普查局的城市名称列表,他们把城市的类型放在最后,这弄乱了我的 match() .

我想做这个:

Middletown Township
Sunny Valley Borough
Hillside Village

进入这个:
Middletown
Sunny Valley
Hillside

有什么建议?理想情况下,我也想知道是否有 lastIndexOf() R 中的函数。

这是dput:
> dput(df1)
structure(list(id = c(1, 2, 3), city = structure(c(2L, 3L, 1L
), .Label = c("Hillside Village", "Middletown Township", "Sunny Valley Borough"
), class = "factor")), .Names = c("id", "city"), row.names = c(NA, 
-3L), class = "data.frame")

最佳答案

这将起作用:

gsub("\\s*\\w*$", "", df1$city)
[1] "Middletown"   "Sunny Valley" "Hillside"   

它删除由一个或多个空格字符组成的任何子字符串,后跟任意数量的“单词”字符(空格、数字或下划线),后跟字符串的结尾。

关于R从字符串中删除最后一个单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13093931/

相关文章:

r - 检查存档中文件的存在(zip)

r - 如何在 R 函数中传递列名称?

php - 你如何创建一个字符串来匹配正则表达式?

r - 如何在R中检查字符串是否包含罗马数字?

c - 在C中以固定长度的字符串作为输入

r - 从 R session 中设置 --args 的值

r - devtools::install_github() - 忽略 SSL 证书验证失败

regex - 通过 Shell 脚本根据表格列从 HTML 中提取文本

c++ - std::string += 运算符

javascript - 字符串到 DOM 到字符串