r - 在 R 中将每行的数据集拆分为较小的文件

我正在分析一个 1.14 GB(1,232,705,653 字节)的数据集。

读取R中的数据时:

trade = read.csv("commodity_trade_statistics_data.csv")

可以看到它有8225871个实例和10个属性。

由于我打算通过 Data Wrangling Web 应用程序分析数据集，该应用程序的导入限制为 100MB，我想知道如何将数据拆分为最大 100MB 的文件？

我打算做的拆分是每行，每个文件都应该包含标题。

最佳答案

将数据帧拆分为所需数量的块。这是一个带有内置 mtcars 的示例数据集:

no_of_chunks <- 5

f <- ceiling(1:nrow(mtcars) / nrow(mtcars) * 5)

res <- split(mtcars, f)

然后，您可以使用 purrr 将结果另存为 csv。 :

library(purrr)
map2(res, paste0("chunk_", names(res), ".csv"), write.csv)

编辑:
在我的问题的上下文中，以下脚本解决了这个问题:

trade = read.csv("commodity_trade_statistics_data.csv")

no_of_chunks <- 14

f <- ceiling(1:nrow(trade) / nrow(trade) * 14)

res <- split(trade, f)

library(purrr)
map2(res, paste0("chunk_", names(res), ".csv"), write.csv)

关于r - 在 R 中将每行的数据集拆分为较小的文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57047338/

上一篇：.net - .NET Core RC2 中的登录声明

下一篇：android-workmanager - 当 onStopped 是 final 时，如何在我的 CoroutineWorker 中执行清理代码？

相关文章：

r - 转换 data.table 中的*一些*列类

r - 如何在不创建一堆新元素的情况下分配给 R 中的列表？

java - "import java.util.function cannot be resolved"错误

c# - SplitContainer 中的固定面板高度

MYSQL - 将数据拆分为多行

r - 计算一个变量或变量组合为TRUE的实例数

r - R 有没有办法过滤数据帧并将其拆分为新的数据帧？

css - polymer 和 bootstrap 问题与 chrome

python - 将文本文件导入到python中的二维列表中添加单引号

java - 拆分一个字节数组...？