string - 在 R 中将字符串拆分为 100 个单词的部分

标签 string r split

如何将一个巨大的“字符”拆分为较小的“字符”,每个较小的字符恰好包含 100 个单词。 例如,我以前就是这样将其拆分为单个单词的。

myCharSplitByWords <- strsplit(myCharUnSplit, " ")[[1]]

我认为这可能可以通过正则表达式来完成(也许选择第 100 个空格或 smth),但无法编写正确的表达式

我是 R 新手,我完全陷入困境。谢谢

最佳答案

也许有一种使用正则表达式的方法,但在 strsplit 之后,通过“手”对单词进行分组会更容易:

## example data
set.seed(1)
string <- paste0(sample(c(LETTERS[1:10], " "), 1e5, replace=TRUE), collapse="")

## split if there is at least one space
words <- strsplit(string, "\\s+")[[1]]

## build group index
group <- rep(seq(ceiling(length(words)/100)), each=100)[1:length(words)]

## split by group index
words100 <- split(words, group)

关于string - 在 R 中将字符串拆分为 100 个单词的部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22910683/

相关文章:

c - Delphi/Pascal 字符串文字到 C/C++

java - "ABC"和新字符串 ("ABC"之间有什么区别)?

c++ - 使用 Rcpp 制作包并尝试让一个类引用另一个类

r - 如何按顺序遍历 r data.frame 中的每一行,然后遍历每一列?

java - 仅比较 Java 中数字字符串的初始部分

python - 在两个对象之间共享一个字符串

c - C语言中如何从字符串中获取单个单词?

r - 找到在行之间进行计算的矢量化方式来执行 for 循环

jquery - 如何将嵌套导航拆分为高度几乎相等的列

javascript - 如何根据三个分隔符拆分字符串?