我需要从文本中提取一些数字。文字是
x <- "Lorem ipsum dolor sit amet[245], consectetur adipiscing (325). Deinde prima illa, quae in congressu[232]. solemus: Quid tu, inquit, huc? Sequitur disserendi ratio cognitioque 295. naturae;"
要提取的数字是 325 和 232。它们在括号内和句尾。不包括其他数字。我试过
strsplit(text, "[A-Za-z]+")
,但没有得到我需要的。
最佳答案
这是一个 stringi
方法
x <- "Lorem ipsum dolor sit amet[245], consectetur adipiscing (325). Deinde prima illa, quae in congressu[232]. solemus: Quid tu, inquit, huc? Sequitur disserendi ratio cognitioque 295. naturae; Claudii libidini, qui tum erat summo ne imperio, dederetur"
library(stringi)
stri_extract_all_regex(x, "(?<=[\\[(])\\d+(?=[\\])][.?!])")
## [[1]]
## [1] "325" "232"
关于regex - 从句子中提取数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25474857/