我一直在研究正则表达式字符串和 strsplit,但不知道如何解决我的问题。
我有一个 html 文档集合,其中始终包含短语“people own those”
。我想提取紧邻该短语之前的数字。即“732,234 人拥有这些”-我希望捕获数字 732,234(包括逗号,尽管我不在乎它是否被删除)。
数字和短语始终由 包围。我尝试使用 Xpath,但这似乎比正则表达式更难。非常感谢任何帮助或建议!
示例字符串:>742,811 人拥有这些<
-> 742,811
最佳答案
您可以尝试以下操作吗?
val <- "742,811 people own these"
gsub(' [a-zA-Z]+',"",val)
输出如下。
[1] "742,811"
说明:这里使用R的gsub(全局替换)函数。将条件放在此处,变量 val
应该用 NULL 替换所有出现的小写或大写字母空格。
关于r - 在 R 中提取字符串之前的数值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53292264/