r - 如何将非乘性数据框划分为尽可能均匀的行

标签 r split

我有一个 196 行长的数据框,我想将其分为 12 组(尽可能均匀)。我只能用 4 组 17 行和 8 组 16 行来做到这一点。

但是,我只在网上找到一个仅适用于乘法数据框的示例:

d <- split(dataFrame,rep(1:12,each=16))

这会将 192 行数据帧拆分为 12 组,每组 16 个连续行。但是,当我尝试将其应用于 196 行数据帧时,出现错误:

Warning message:
In split.default(x = seq_len(nrow(x)), f = f, drop = drop, ...) :
  data length is not a multiple of split variable

我理解错误消息,我只是不知道表明我希望将任何剩余部分尽可能均匀地分配给各组。

最佳答案

我认为您正在寻找如何处理组的数量而不除以数据帧的长度。 cut 函数可以很好地处理此问题,该函数对数据框每行的行号进行操作:

dat <- data.frame(x=1:196)
spl <- split(dat, cut(seq(nrow(dat)), 12))
str(spl)
# List of 12
#  $ (0.805,17.1]:'data.frame': 17 obs. of  1 variable:
#   ..$ x: int [1:17] 1 2 3 4 5 6 7 8 9 10 ...
#  $ (17.1,33.4] :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 18 19 20 21 22 23 24 25 26 27 ...
#  $ (33.4,49.7] :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 34 35 36 37 38 39 40 41 42 43 ...
#  $ (49.7,65.9] :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 50 51 52 53 54 55 56 57 58 59 ...
#  $ (65.9,82.2] :'data.frame': 17 obs. of  1 variable:
#   ..$ x: int [1:17] 66 67 68 69 70 71 72 73 74 75 ...
#  $ (82.2,98.5] :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 83 84 85 86 87 88 89 90 91 92 ...
#  $ (98.5,115]  :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 99 100 101 102 103 104 105 106 107 108 ...
#  $ (115,131]   :'data.frame': 17 obs. of  1 variable:
#   ..$ x: int [1:17] 115 116 117 118 119 120 121 122 123 124 ...
#  $ (131,147]   :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 132 133 134 135 136 137 138 139 140 141 ...
#  $ (147,164]   :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 148 149 150 151 152 153 154 155 156 157 ...
#  $ (164,180]   :'data.frame': 16 obs. of  1 variable:
#   ..$ x: int [1:16] 164 165 166 167 168 169 170 171 172 173 ...
#  $ (180,196]   :'data.frame': 17 obs. of  1 variable:
#   ..$ x: int [1:17] 180 181 182 183 184 185 186 187 188 189 ...

从摘要输出中可以看出,其中 4 个组有 17 个观测值,其余 8 个组有 16 个观测值。

关于r - 如何将非乘性数据框划分为尽可能均匀的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23234456/

相关文章:

r - 为 ggplot2 组织物理实验数据

r - 插入符::varImp for GLM model worked before and gives me an error

r - 在散点图中以不同的方式着色/填充一点

java - 按路径拆分正则表达式

linux - 有没有办法设置绘图窗口的默认大小?

text - 为什么字段分隔符必须只有一个字节?

java - 字符串, 拆分.需要帮助理解

ruby - 如何在 Ruby 中将字符串拆分为两个具有给定字符的部分?

javascript - 无法解析 javascript 中的字符串

带有点符号的变量的 JavaScript 连续 split()