r - R 中的子字符串和 gsub

标签 r substring gsub

我有从网站提取的格式类似于 \t\tloc: 'Silver Spring, MD', 的字符串,并且只想检索城市名称和州缩写,例如马里兰州银泉。我正在考虑将 gsubsubstr 结合起来,但城市名称可能会根据其他数据进行更改,因此给出 substr 是没有意义的code> 开始和结束索引。这是我迄今为止尝试过的代码:

# Would like to extract the string "Silver Spring, MD"
# What I tried:
ldata <- "\t\tloc: 'Silver Spring, MD',"
dt<- gsub(".*: ", "",ldata)
# Produces: 'Silver Spring, MD',"

但是,字符串始终以相同的方式显示,城市名称位于字符串段的“ABCDE, FG”部分。我是 R 新手,所以是否有更有效的方法来做到这一点。

最佳答案

dt<-sub(".*'(.*)'.*","\\1",ldata)

关于r - R 中的子字符串和 gsub,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30672419/

相关文章:

php - 将字符串拆分为字典单词

java - 是否可以反转子字符串的起点和终点?

ruby - 正则表达式/从 ruby​​ 中的字符串中删除斜线

ruby - 为什么 gsub 的 '\1' 捕获组会产生这个字符串?

r - Gsub R中关键字后的每个元素

r - 如何计算给定因子中每个级别的值?

r - 将data.frame转换为data.table列丢失

替换字符串中的非重复字符

r - 输入变量列表,无需在它们之间手动添加逗号

excel - VBA - 找到第二次出现的子字符串 "TL"并删除之后的所有内容