r - 从单个字符串中提取多个子字符串

标签 r text

我想从推文中提取标签(推特句柄)。

tweet <- "@me bla bla bla bla @him some text @her"

和:

at <- regexpr('@[[:alnum:]]*', tweet)
handle <- substr(tweet,at+1,at+attr(at,"match.length")-1)

我成功提取了第一个句柄

handle
[1] "me"

但是我无法找到提取其他方法的方法，有人知道这样做的方法吗？ - 谢谢

最佳答案

我会建议:

tweet <- "@me bla bla bla bla @him some text @her"
regmatches(tweet, gregexpr("(?<=@)[a-z]+", tweet,perl=T))

## [[1]]
## [1] "me"  "him" "her"

关于r - 从单个字符串中提取多个子字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25543306/

相关文章：

android - 应用程序在同一型号的两部手机中显示不同的文字大小