scikit-learn - 尽管标签相关性很强，但为什么多标签性能结果与独立性能结果相同？

标签 scikit-learn label multilabel-classification scikit-multilearn

我有一个带有 2 个标签的数据集，我知道这 2 个标签之间存在很强的相关性。但是，当我使用不考虑相关性的 scikit 多学习二进制相关性时，我得到的结果与考虑这些标签相关性的 Labelpowerset 分类器非常相似？对此有何评论？
此外我使用 http://scikit-multilearn.github.io/
我不知道它的有效性如何？？

最佳答案

我是 scikit-multilearn 的作者。为了回答您的问题，我需要查看标签组合图。两个标签产生 4 种组合，但如果组合 [1,0] 和 [0,1] 在 [0,0] 或 [1,1] 的情况下占主导地位，那么您可能会遇到标签 Powerset 无法正确学习相关案例的基本分类器。它还取决于您使用哪种措施来验证性能？

关于scikit-learn - 尽管标签相关性很强，但为什么多标签性能结果与独立性能结果相同？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31093145/

上一篇：netbeans - 我安装了 NetBeans 8.2，但无法更改 UI 语言。我没有找到任何选项。有什么建议么？

下一篇：scikit-learn - 指定质心的 kmeans 聚类变换方法

相关文章：

python - 获取 OpenERP 中字段的标签名称

R:XGBoost 和特征哈希。 MError不断增加

python - 绘制多标签分类 Python 的混淆矩阵

python - 如何使用 statsmodels.formula.api (python) 预测新值

algorithm - KMeans 评估指标不收敛。这是正常行为还是不正常？

python - 为什么优化模型精度会由于没有预测样本而引发错误 : Precision is ill-defined and being set to 0. 0？

ios - 确定最后一行在 UILabel 中的结束位置

machine-learning - 带有随机森林的 AdaBoostClassifier 用于多标签分类 (sklearn)

ios - 文本下划线 - createLabel

machine-learning - 多标签分类 keras 的奇怪准确性