在 R 中读取大数据和逻辑回归

标签 r bigdata regression logistic-regression read.table

情况:1GB CSV 文件,100000 行,4000 个自变量,1 个因变量。 Windows Citrix 服务器上的 R,内存为 16GB。

问题:我花了 2 个小时!做:

read.table("full_data.csv", header=T, sep",")

glm 进程崩溃,程序没有响应,我必须在任务管理器中将其关闭。

最佳答案

我经常求助于 sqldf 包在内存中加载大型 .csv。一个好的指针是 here .

关于在 R 中读取大数据和逻辑回归,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11400943/

相关文章:

algorithm - 通过最小化正交距离的最佳拟合平面

r - 用于可视化离散和连续面板数据的加权桑基/冲积图?

r - R 中的数据帧 : creating a new column which contains a value from a second column which is named in a third column

r - 如何在R中的嵌套列表中取元素的并集

r - 输出提示中出现 [1] 的名称和原因是什么?

c++ - 如何用C/C++读取/恢复大数据文件(SEGY格式)?

unit-testing - 如何克服单元测试回归问题......?

python - 如何在 plotly express scatter 中为多种颜色设置一条趋势线?

bigdata - vaex数据框不支持数据生成吗

apache-spark - Spark Dataframe 丢失分区