r - 是否有正则表达式可以查找两个正斜杠之间和特定字符串之后的字符串? [R]

标签 r regex regex-lookarounds

我有一个数据框,其中有一列包含如下 UR:

https://www.facebook.com/nameofpage/posts/13142894231

我试图仅将此列的 nameofpage 部分提取到新列中。我不知道如何在该确切位置提取字符串。该字符串有时包含文字“.”、文本和数字。

我一直在尝试使用 strsplitseparate 从 tidyr 中取得的成功有限。

tidyr 代码如下所示:

  separate(Link, c(NA, NA, NA, "target"), sep = "/")

但是,这确实根本不起作用。

我希望将 nameofpage 提取到列中,但有时输出实际上是 URL 的另一部分。

最佳答案

您可以使用stringr包中的str_split

URL = "https://www.facebook.com/nameofpage/posts/13142894231"

library(stringr)

str_split(URL, "/")
[[1]]
[1] "https:"           ""                 "www.facebook.com" "nameofpage"      
[5] "posts"            "13142894231"     

str_split(URL, "/")[[1]][4]
[1] "nameofpage"

关于r - 是否有正则表达式可以查找两个正斜杠之间和特定字符串之后的字符串? [R],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55436129/

相关文章:

java - 匹配前面没有文字的电话号码

python - 正则表达式匹配两个字符串,字符串之间有给定的单词数

从列名中删除部分字符串

r - gWidgets 和 rGtk2 与 ggroup 的问题

r - R的 'weekdays'函数是否得到错误的日期?

python - 仅在 a 元素中用于 href 的正则表达式

r - 防止 as.character 使用指数符号 r

java - 正则表达式在 Java 中第一次出现时停止

regex - Perl 正则表达式 : Negative lookaheads

regex - 具有负前瞻的递归正则表达式