machine-learning - 添加特征一定会让模型变得更好吗?

标签 machine-learning statistics classification random-forest treemodel

我训练了一个 GBDT 模型来预测 CTR,最初使用 40 个特征。然后我又加了一些功能,但是AUC比原来低了。

  1. 怎么会发生这种事?

  2. 如何确定哪个特征适合模型?

最佳答案

如果添加更多特征会降低性能,则可能是由于过度拟合。您需要调整模型学习参数以避免模型过于复杂(过度拟合)。

对于随机森林,树深度就是这样的参数之一。不应允许树木生长得太深,否则它们可能会过度拟合(即使有很多树木,这种情况也可能发生在随机森林中)。

关于machine-learning - 添加特征一定会让模型变得更好吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28983237/

相关文章:

python - 喀拉斯 : training with an array as an input

python - 有没有办法让这个 Python kNN 函数更高效?

algorithm - 如何找到用隐马尔可夫模型解决的问题示例?

R - 如何根据同一行另一列的值从一列中获取值

java - Weka 安装 libsvm

python - 使用 Sci-Kit 学习对大型语料库的文本进行分类

time-series - 我们可以预测每个客户进行交易的日期吗?

python - model.predict() 返回类而不是概率

python - 基于cvxopt的python半定嵌入

python - Pandas corr() 返回 NaN 的频率太高