machine-learning - 分类器可以拒绝对 x% 的测试数据进行分类? (以提高精度)

标签 machine-learning classification

我正在开展一项研究,我想提出一种方法,拒绝对测试数据的某些恒定部分进行分类(例如 20%,五分之一的分类可以由算法)。我们的想法是拥有一种算法,可以有效地选择哪些分类最有可能是错误的,并拒绝回答它们(以提高整体准确性)。

我想知道是否有任何通用的机器学习方法(独立于使用的分类器)来实现这一点?

任何答案都会有帮助,谢谢。

最佳答案

逻辑回归分类器将输出示例属于正类别或负类别的概率。在这种情况下,设置一个阈值来将示例标记为“未知”是可行的。例如,任何返回 <.6 正或负概率的内容都可以标记为未知。

正如另一位发帖者所建议的,另一种方法是将问题视为排名问题。线性分类器(如支持向量机和逻辑回归)输出示例与分离超平面的距离。您可以使用此距离的绝对值对示例进行排名,然后将排名最低(最接近分离超平面)的 20% 的测试示例分类为未知。

关于machine-learning - 分类器可以拒绝对 x% 的测试数据进行分类? (以提高精度),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11252159/

相关文章:

machine-learning - 如何输出机器学习分类算法的特征向量

使用 Softmax 进行二元分类

python - 如何在 GridSearchCV 中评估分类器的准确性并生成留一的 roc 曲线?

algorithm - Apache Spark Mllib 中 ALS 机器学习算法的排名是多少

java - 精细文本分类 - 什么算法?

machine-learning - 分类监督训练困惑

math - 无法理解线性回归的成本函数

python - 能否将 Tensorflow 变量保存为字符串或流?

python - Keras Conditional GAN 训练不好

python - 每个训练数据的类标签分布不均匀的多标签文本分类