我有一个数据框,其中有一列包含如下 UR:
https://www.facebook.com/nameofpage/posts/13142894231
我试图仅将此列的 nameofpage
部分提取到新列中。我不知道如何在该确切位置提取字符串。该字符串有时包含文字“.”、文本和数字。
我一直在尝试使用 strsplit
和 separate
从 tidyr 中取得的成功有限。
tidyr 代码如下所示:
separate(Link, c(NA, NA, NA, "target"), sep = "/")
但是,这确实根本不起作用。
我希望将 nameofpage
提取到列中,但有时输出实际上是 URL 的另一部分。
最佳答案
您可以使用stringr
包中的str_split
。
URL = "https://www.facebook.com/nameofpage/posts/13142894231"
library(stringr)
str_split(URL, "/")
[[1]]
[1] "https:" "" "www.facebook.com" "nameofpage"
[5] "posts" "13142894231"
str_split(URL, "/")[[1]][4]
[1] "nameofpage"
关于r - 是否有正则表达式可以查找两个正斜杠之间和特定字符串之后的字符串? [R],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55436129/