machine-learning - 添加特征一定会让模型变得更好吗？

标签 machine-learning statistics classification random-forest treemodel

我训练了一个 GBDT 模型来预测 CTR，最初使用 40 个特征。然后我又加了一些功能，但是AUC比原来低了。

怎么会发生这种事？
如何确定哪个特征适合模型？

最佳答案

如果添加更多特征会降低性能，则可能是由于过度拟合。您需要调整模型学习参数以避免模型过于复杂(过度拟合)。

对于随机森林，树深度就是这样的参数之一。不应允许树木生长得太深，否则它们可能会过度拟合(即使有很多树木，这种情况也可能发生在随机森林中)。

关于machine-learning - 添加特征一定会让模型变得更好吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28983237/

上一篇：machine-learning - 如何为卷积神经网络选择滤波器

下一篇：machine-learning - kNN 最先进的实现

相关文章：

python - 喀拉斯 : training with an array as an input

python - 有没有办法让这个 Python kNN 函数更高效？

algorithm - 如何找到用隐马尔可夫模型解决的问题示例？

R - 如何根据同一行另一列的值从一列中获取值

java - Weka 安装 libsvm

python - 使用 Sci-Kit 学习对大型语料库的文本进行分类

time-series - 我们可以预测每个客户进行交易的日期吗？

python - model.predict() 返回类而不是概率

python - 基于cvxopt的python半定嵌入

python - Pandas corr() 返回 NaN 的频率太高

©2024 IT工具网联系我们