r - 从单个字符串中提取多个子字符串

标签 r text

我想从推文中提取标签(推特句柄)。

tweet <- "@me bla bla bla bla @him some text @her"

和:
at <- regexpr('@[[:alnum:]]*', tweet)
handle <- substr(tweet,at+1,at+attr(at,"match.length")-1)

我成功提取了第一个句柄
handle
[1] "me"

但是我无法找到提取其他方法的方法,有人知道这样做的方法吗? - 谢谢

最佳答案

我会建议:

tweet <- "@me bla bla bla bla @him some text @her"
regmatches(tweet, gregexpr("(?<=@)[a-z]+", tweet,perl=T))

## [[1]]
## [1] "me"  "him" "her"

关于r - 从单个字符串中提取多个子字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25543306/

相关文章:

android - 应用程序在同一型号的两部手机中显示不同的文字大小

java - 根据文本调整 JButton 和其他组件的大小

r - 如果前一行具有相同的值/字符串,则删除行(对于每组)

r - 检查日期列表是否在 r 中的日期范围内

RStudio R 文件损坏

c++ - 使用 OpenCV 显示图像并在 C++ 中的特定位置输入文本

android - Android 中的文本作为图像

php - php 中的文本到十六进制转换不准确

file-io - 如何在 R 中编写 CSV,并在 R 中保持矩阵名称 (dimnames(M)) 不变?

r - 错误 1 ​​:N : NA/NaN argument