如何将一个巨大的“字符”拆分为较小的“字符”,每个较小的字符恰好包含 100 个单词。 例如,我以前就是这样将其拆分为单个单词的。
myCharSplitByWords <- strsplit(myCharUnSplit, " ")[[1]]
我认为这可能可以通过正则表达式来完成(也许选择第 100 个空格或 smth),但无法编写正确的表达式
我是 R 新手,我完全陷入困境。谢谢
最佳答案
也许有一种使用正则表达式的方法,但在 strsplit
之后,通过“手”对单词进行分组会更容易:
## example data
set.seed(1)
string <- paste0(sample(c(LETTERS[1:10], " "), 1e5, replace=TRUE), collapse="")
## split if there is at least one space
words <- strsplit(string, "\\s+")[[1]]
## build group index
group <- rep(seq(ceiling(length(words)/100)), each=100)[1:length(words)]
## split by group index
words100 <- split(words, group)
关于string - 在 R 中将字符串拆分为 100 个单词的部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22910683/