情况:1GB CSV 文件,100000 行,4000 个自变量,1 个因变量。 Windows Citrix 服务器上的 R,内存为 16GB。
问题:我花了 2 个小时!做:
read.table("full_data.csv", header=T, sep",")
glm 进程崩溃,程序没有响应,我必须在任务管理器中将其关闭。
最佳答案
我经常求助于 sqldf
包在内存中加载大型 .csv。一个好的指针是 here .
关于在 R 中读取大数据和逻辑回归,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11400943/