r - 在 R 中提取字符串之前的数值

标签 r

我一直在研究正则表达式字符串和 strsplit,但不知道如何解决我的问题。

我有一个 html 文档集合,其中始终包含短语“people own those”。我想提取紧邻该短语之前的数字。即“732,234 人拥有这些”-我希望捕获数字 732,234(包括逗号,尽管我不在乎它是否被删除)。 数字和短语始终由 包围。我尝试使用 Xpath,但这似乎比正则表达式更难。非常感谢任何帮助或建议!

示例字符串:>742,811 人拥有这些<

-> 742,811

最佳答案

您可以尝试以下操作吗?

val <- "742,811 people own these"
gsub(' [a-zA-Z]+',"",val)

输出如下。

[1] "742,811"

说明:这里使用R的gsub(全局替换)函数。将条件放在此处,变量 val 应该用 NULL 替换所有出现的小写或大写字母空格。

关于r - 在 R 中提取字符串之前的数值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53292264/

相关文章:

R:根据特定条件删除重复行

RRF 模型给出的测试集 NA

r - 如何绘制 ggplot2 散点图的特定颜色和形状?

r - R 的 ifelse 如何处理字符数据?

R:以pdf为背景绘图

r - 如何保持数据文件中相关图标签的顺序相同?

R 中的保留和滞后函数作为 SAS

r - 如何在 R 中创建稀疏矩阵

r - 通过名称或索引引用列的函数

R根据NA值分割数据帧