regex - 在 R 中使用正则表达式拆分字符串

标签 regex r split

假设我们有以下字符串。

str <- '<a><b><c>';

我需要拆分它以便输出是 'a' 的向量, 'b' , 'c' .

基本上我可能需要一个 RegEx 拆分函数来取出 <(*)> 的实例来自原始字符串并将它们添加到新向量中。

最佳答案

str <- '<a><b><c>'
str <- gsub('<|>','',str)
str <- unlist(strsplit(str,'',fixed=TRUE))  # or: strsplit(str,'',fixed=TRUE)[[1]]

给出:

> str
[1] "a" "b" "c"

回应您的评论:

str2 <- '<ab><bc><cd>'
str2 <- unlist(strsplit(str2,'><',fixed=TRUE))  # or: strsplit(str2,'><',fixed=TRUE)[[1]]
str2 <- gsub('<|>','',str2)

给出:

> str2
[1] "ab" "bc" "cd"

关于regex - 在 R 中使用正则表达式拆分字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34254598/

相关文章:

regex - grep 替换为广泛的正则表达式实现

regex - 在 Go Regex 中使用 Or | 组

java - 如何匹配正则表达式中的整个标签?

python - 当列表元素是需要解析的文本页时,如何将列表的每个元素存储在数据框中?

c# - 拆分字符串值并存储在列表中

java - 使用Java解析多个双引号文件名

python - 使用 Python(或 R)提取谷歌学术搜索结果

python - R、Python、rpy2 : "Error: cannot allocate vector of size xxx Mb"

r - 使用 devtools::install_local 构建小插图 - 在一个小插图中创建的全局变量在另一个小插图中可用

r - 将逗号分隔的字符串拆分为 R 中定义数量的片段