我想从推文中提取标签(推特句柄)。
tweet <- "@me bla bla bla bla @him some text @her"
和:
at <- regexpr('@[[:alnum:]]*', tweet)
handle <- substr(tweet,at+1,at+attr(at,"match.length")-1)
我成功提取了第一个句柄
handle
[1] "me"
但是我无法找到提取其他方法的方法,有人知道这样做的方法吗? - 谢谢
最佳答案
我会建议:
tweet <- "@me bla bla bla bla @him some text @her"
regmatches(tweet, gregexpr("(?<=@)[a-z]+", tweet,perl=T))
## [[1]]
## [1] "me" "him" "her"
关于r - 从单个字符串中提取多个子字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25543306/