R:当列数为素数时分割数据框

标签 r split dataframe primes

我有一个包含 131 列的 data.frame。我需要将其分成大约 10 到 15 个变量的组(即按列拆分,而不是按行拆分!)。显然,由于 131 是质数,因此并非所有新数据帧的长度都可以相同......

我在帖子中寻找答案

但他们似乎都假设新数据帧的大小相同。

编辑 感谢下面的评论,我将尽力澄清:

我的数据框看起来像这样

head(trainData)
 ID          drop_vce_Range drop_dat_Range blck_vce_Range blck_dat_Range
48550           high            low           high            low
30965            low            low           high           high
40501            low            low            med            low
41771            med            low            low            low
42138            med            low            low            low
42975           high            low            low            low

此数据框有 131 列。我希望在我的 globalenv 中包含多个数据框,例如名称为“Training_Part_1”、“Training_Part_2”等的数据框。每个新的 data.frame 都应包含旧 data.frame 的大约 15 列。

最佳答案

这将创建一个数据框列表,该列表是通过将内置数据框 anscombe 的 8 列切割成 3 个不相等的集合而形成的:

k <- 3
nc <- ncol(anscombe)
lapply(split(as.list(anscombe), cut(1:nc, k, labels = FALSE)), as.data.frame)

关于R:当列数为素数时分割数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29011315/

相关文章:

python - (生物医学)词干的所有可能词形补全

c# - 使用正则表达式按非数字和数字拆分字符串

regex - Perl 正则表达式用新行拆分

python - GroupSplitShuffle 和 GroupKFolds 之间的区别

python - PySpark:向数据框行元素添加新字段

Python pandas.core.frame.Dataframe 索引不正确/如何删除 csv 文件每行末尾的逗号?

r - 如何在正确的方向上记录变换 R geom_histogram 的 y 轴?

r - 改变 ggplot 中特定点的颜色

r - 对一系列经度和纬度值进行子集化

python - 如何通过 ID 保留第一个条目? Pandas python