r - 当权重存在时,glmnet 如何标准化变量?

标签 r machine-learning glmnet

glmnet 允许用户通过 weights 参数输入观察权重向量。 glmnet 还标准化(默认情况下)预测变量以具有零均值和单位方差。我的问题是:当提供 weights 时,glmnet 是否使用每列的加权平均值(和标准差)或未加权平均值(和标准差)来标准化预测变量?

最佳答案

Link 有关于 glmnet 标准化的描述。

在帖子中,您可以看到用于计算标准化的 glmnet 源代码的 Fortran 代码片段。 (“证明”段落,第二个项目符号)。

我不熟悉 Fortran,但对我来说,它看起来很像实际上使用加权均值和标准差。

编辑:来自 glmnet 小插图:

"weights is for the observation weights. Default is 1 for each observation. (Note: glmnet rescales the weights to sum to N, the sample size.)"

Fortran 代码中的 w 是重新缩放的权重,这似乎与加权平均标准化一致。

关于r - 当权重存在时,glmnet 如何标准化变量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41122803/

相关文章:

java - 硬编码与文件输入的效率

Tensorflow:如何处理多个输入

在 R 中 reshape data.frame

r - 根据某些条件生成随机数

r - 将变量传递到 data.table

r - 强制 R(和 Rstudio)在 Windows 上使用虚拟内存

python - Keras model.fit log 和 Sklearn.metrics.confusion_matrix 报告的验证准确性指标彼此不匹配

r - 如何在 R 中使用 glmnet 解决分类问题

r - "get_int_parms"不适用于包 "glmnet"的 .Fortran()

R:glmnet:强制系数为某个符号