是否可以从 GBM 拟合模型中删除数据?我知道 keep.data
选项。但是,我希望能够在处理过程中保留数据,然后将其精简。另外,如果我只想保留一棵树用于将来的预测(假设在拟合 1000 棵树之后,我认为 500 棵树在我的情况下效果最好,所以我想只保留这棵树。有没有安全的方法从拟合模型中删除多余的数据而不影响预测新数据的能力?
最佳答案
我认为唯一真正有用的方法是按照您的建议去除多余的树木。
如果我在 gbm 示例上运行以下命令,我会发现树占对象大小的 80%,数据占 10%。因此删除多余的树可以节省大量空间。
library(pryr)
bit <- unlist(lapply(gbm1,object_size))
round(bit/sum(bit),3)
您还可以尝试压缩对象,这会显着减小其大小。
memCompress(serialize(gbm1, NULL), "bzip2")
unserialize(memDecompress(gbm1, type = "bzip2"))
关于r - 是否有可能在 R 中精简 GBM 模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31473103/