r - 从文本中提取字母数字字符串

标签 r

背景

问题

我有一个字符串

str_temp <- "{type: [{a: a1, timestamp: 1}, {a:a2, timestamp: 2}]}"

我想从中提取所有七个字母数字子字符串:type、a、a1、timestamp、a、a2、timestamp。但是，我无法让我的正则表达式工作。

我已经使用[:word:]、[:alnum:]、[:alpha:]等的各种组合尝试了基础R和library(stringr) .

一个例子:

> pattern <- "[:word:]"
> str_locate_all(str_temp, pattern)
[[1]]
     start end
[1,]     6   6
[2,]    11  11
[3,]    26  26
[4,]    34  34
[5,]    48  48

但这只是给了我字符串type、a、timestamp、的端点>a，时间戳，而不是起点，或者a1或a2。

提取所有七个字母数字字符串的正确正则表达式是什么？

最佳答案

这是一个有效的正则表达式。匹配所有字母数字单词，但不匹配数字。

((?![0-9]+)[A-Za-z0-9]+)

http://www.rubular.com/r/EuF9AfdtXW

感谢 Richard 展示了如何在 r 中使用它:

regmatches(str_temp, gregexpr("((?![0-9]+)[A-Za-z0-9]+)", str_temp, perl = TRUE))[[1L]]

关于r - 从文本中提取字母数字字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29550681/

上一篇：angularjs - ngModel 及其使用方法

下一篇：qt - qt应用程序的多个样式表

相关文章：

重命名管道中的多个变量

r - 将绘图保存在 data.table 列表列中

r - 有没有办法使用 R 将文件写入使用 SSL 的 FTP 服务器？

R:如何从 R 包中的 inst/extdata 延迟加载变量

r - 向文本元素添加空格

r - 散点图 : Error in FUN(X[[i]], ...):找不到对象 'Group'

发生时复制每一行data.frame

r - 在R中，有一种方法可以使用带有任意参数的pivot_longer作为cols规范

r - 计算 R 中分类变量的出现次数

使用 writeogr() 下载 Shapefile 时出现 R Shiny downloadHandler() 错误