我训练了一个 GBDT 模型来预测 CTR,最初使用 40 个特征。然后我又加了一些功能,但是AUC比原来低了。
怎么会发生这种事?
如何确定哪个特征适合模型?
最佳答案
如果添加更多特征会降低性能,则可能是由于过度拟合。您需要调整模型学习参数以避免模型过于复杂(过度拟合)。
对于随机森林,树深度就是这样的参数之一。不应允许树木生长得太深,否则它们可能会过度拟合(即使有很多树木,这种情况也可能发生在随机森林中)。
关于machine-learning - 添加特征一定会让模型变得更好吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28983237/