r - 是否有可能在 R 中精简 GBM 模型?

标签 r model machine-learning size gbm

是否可以从 GBM 拟合模型中删除数据?我知道 keep.data 选项。但是,我希望能够在处理过程中保留数据,然后将其精简。另外,如果我只想保留一棵树用于将来的预测(假设在拟合 1000 棵树之后,我认为 500 棵树在我的情况下效果最好,所以我想只保留这棵树。有没有安全的方法从拟合模型中删除多余的数据而不影响预测新数据的能力?

最佳答案

我认为唯一真正有用的方法是按照您的建议去除多余的树木。

如果我在 gbm 示例上运行以下命令,我会发现树占对象大小的 80%,数据占 10%。因此删除多余的树可以节省大量空间。

library(pryr)
bit <- unlist(lapply(gbm1,object_size))
round(bit/sum(bit),3)

您还可以尝试压缩对象,这会显着减小其大小。

memCompress(serialize(gbm1, NULL), "bzip2")
unserialize(memDecompress(gbm1, type = "bzip2"))

关于r - 是否有可能在 R 中精简 GBM 模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31473103/

相关文章:

在不安装 Java 的情况下将受密码保护的 xlsx 文件读入 R(密码已知)

r - gsub 从 R 中的向量中提取点前后的字符串?

java - 学习元素排序的算法(最好在 Java 中)

r - 根据索引有条件地替换向量的元素

arrays - 如何在R中创建列表矩阵?

ruby-on-rails - 在 Rails 中实现租赁商店 : how to track an inventory state over time?

ios - 如何更优雅地添加/删除表格 View 中的单元格?

testing - NestJS 如何在单元测试中创建新的 Mongoose 模型?

machine-learning - Isolation Forest 需要数据标准化吗?

python - 为什么标准化后新值大于 1 和 -1?