r - 在 R 中提取字符串之前的数值

标签 r

我一直在研究正则表达式字符串和 strsplit，但不知道如何解决我的问题。

我有一个 html 文档集合，其中始终包含短语“people own those”。我想提取紧邻该短语之前的数字。即“732,234 人拥有这些”-我希望捕获数字 732,234(包括逗号，尽管我不在乎它是否被删除)。数字和短语始终由包围。我尝试使用 Xpath，但这似乎比正则表达式更难。非常感谢任何帮助或建议!

示例字符串:>742,811 人拥有这些<

-> 742,811

最佳答案

您可以尝试以下操作吗？

val <- "742,811 people own these"
gsub(' [a-zA-Z]+',"",val)

输出如下。

[1] "742,811"

说明:这里使用R的gsub(全局替换)函数。将条件放在此处，变量 val 应该用 NULL 替换所有出现的小写或大写字母空格。

关于r - 在 R 中提取字符串之前的数值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53292264/

上一篇：JSONSchema 将一个大模式文件拆分为多个逻辑小文件

下一篇：sbt - 使用 SBT 进行多版本构建

相关文章：

R:根据特定条件删除重复行

RRF 模型给出的测试集 NA

r - 如何绘制 ggplot2 散点图的特定颜色和形状？

r - R 的 ifelse 如何处理字符数据？

R:以pdf为背景绘图

r - 如何保持数据文件中相关图标签的顺序相同？