machine-learning - 机器学习分类: Target variable almost completely one class

我有一个目标变量，可以是0或1，其中99.34%是0(总共大约50,000个条目)。逻辑回归和朴素贝叶斯都只是预测全零。有人对此类问题有建议吗？我想确定功能的重要性。干杯

编辑:我有大约 10 个特征可以用来预测

最佳答案

一种可能性是为训练示例赋予权重，以便 1 类示例在损失函数中比 0 类示例更重要。我不确定您正在使用什么语言/库，但例如scikit-learn 的 LogisticRegression有一个名为 class_weight 的参数可以为您处理这个问题(通过将其设置为 'balanced' 或您自己选择)。或者，如果您从头开始实现了逻辑回归，您可以自己轻松地将这些权重添加到损失函数中；它不会使梯度计算变得更加复杂。

关于machine-learning - 机器学习分类: Target variable almost completely one class，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38513053/

上一篇：machine-learning - 为什么神经元网络的隐藏状态不能提供比原始输入更好的降维结果？

下一篇：machine-learning - CRF(条件随机场)可以用来标记整个句子吗？

相关文章：

python - 如何在核密度估计中找到局部最大值？

java - Eclipse IDE - Classnotfound 异常，即使路径已知。为什么 Eclipse 可以在一个项目中找到库，而在另一个项目中找不到？

python - 如何使用具有自定义功能的 sklearn 管道？

python - 导入错误 : No module named grid_search, learning_curve

python - 双向 LSTM 的问题

machine-learning - Keras 自动编码器负损失和 val_loss 数据在 [-1 1] 范围内

python - Keras 中二元分类的输出层

python - 使用高斯混合模型和 scikit learn 进行多类分类

java - 如何禁用 libsvm (java) 中的控制台输出

machine-learning - 将 Adaboost(自适应提升)方法与决策树结合使用的示例是什么