python - 强制分类器选择固定数量的目标

标签 python machine-learning classification random-forest

如果我有一个包含事件的数据集,其中每个事件都有 1000 个可能项目的数据,每个事件只有 100 个是正确的。如何强制分类器为每个事件仅选择 100 个?

在我通过训练模型(具有 18 个特征,并且始终有 100 个目标/事件标记为 1)运行它之后,分类器会选择 60-80 个项目而不是 100 个之间的任意项目。即使我为每个事件提供一个事件编号,也不会没有帮助。

我正在使用 python sklearn 梯度增强和随机森林方法。

最佳答案

你自己做吧。 scikit-learn 中的每个分类器都可以让您访问decision_function 或predict_proba,两者都支持预测操作(predict 只是其中的argmax)。因此 - 只需选择支持度最高的 100 个即可。

关于python - 强制分类器选择固定数量的目标,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35637968/

相关文章:

python - 如何使用 Odoo 12 中看板 View 的 default_group_by 字段选择对位置阶段进行排序

python - 如何自动滚动 gtk.scrolledwindow?

python - CNN 模型比 CNN-SVM 组合模型具有更好的精度

machine-learning - 训练朴素贝叶斯分类器

python - 如何工作 "expand cells containing lists into their own variables in pandas"

python - 如何在python中使用gensim获取相关的匹配词?

nlp - 大数据集的最大熵分类器

c++ - 形状不匹配,同时从 caffe 中自己训练的网络复制权重

python - 精度卡在 50% Keras

matlab - 测试性能分类器matlab