r - 虚拟变量和预处理

标签 r r-caret

我有一个包含一些虚拟变量的数据框,我想将其用作 glmnet 的训练集.

因为我正在使用 glmnet我想使用 preProcess 来居中和缩放特征插入符号中的选项 train功能。我不希望这种转换也应用于虚拟变量。

有没有办法阻止这些变量的转换?

最佳答案

除了编写 custom model 之外,(目前)没有其他方法可以做到这一点。这样做(请参阅接近尾声的 PLS 和 RF 示例)。

我正在研究一种方法来指定哪些变量获得哪种预处理方法。但是,对于虚拟变量,这很困难,因为您可能需要指定许多列不在当前数据集中的预测变量的名称。这个想法是能够使用通配符(例如 Species* 来捕获 SpeciesversicolorSpeciesvirginica ),但代码还没有完成。

最大限度

关于r - 虚拟变量和预处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37273149/

相关文章:

r - 具有对数刻度和自定义中断的直方图

r - 使用 data.table 选择非唯一行

r - 如何将指定行数从 R 的历史记录保存到文件中?

R - 使用 ifelse 语句在不同的列上分配一个数字的份额

R : Caret how do we pass a parameter for k for kNN

r - 如何绘制用插入符号构建的极限梯度提升树

R - 制作二进制变量的函数

r - 无法在 R 中加载 'Caret'

r - Microsoft Azure ML 中的插入符包

r - 错误: `data` and `reference` should be factors with the same levels.使用confusionMatrix(插入符号)