我有一个包含一些虚拟变量的数据框,我想将其用作 glmnet
的训练集.
因为我正在使用 glmnet
我想使用 preProcess
来居中和缩放特征插入符号中的选项 train
功能。我不希望这种转换也应用于虚拟变量。
有没有办法阻止这些变量的转换?
最佳答案
除了编写 custom model 之外,(目前)没有其他方法可以做到这一点。这样做(请参阅接近尾声的 PLS 和 RF 示例)。
我正在研究一种方法来指定哪些变量获得哪种预处理方法。但是,对于虚拟变量,这很困难,因为您可能需要指定许多列不在当前数据集中的预测变量的名称。这个想法是能够使用通配符(例如 Species*
来捕获 Speciesversicolor
和 Speciesvirginica
),但代码还没有完成。
最大限度
关于r - 虚拟变量和预处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37273149/