apache-spark - Spark ML - MulticlassClassificationEvaluator - 我们可以通过每个类标签获得精度/召回率吗？

标签 apache-spark machine-learning apache-spark-ml multiclass-classification

我正在 Spark ML 中使用随机森林进行多类预测。

对于 Spark ML 中的 MulticlassClassificationEvaluator()，是否可以通过每个类标签获得精度/召回率？

目前，我只看到所有类别的精确度/召回率相结合。

最佳答案

直接使用org.apache.spark.mllib.evaluation.MulticlassMetrics，然后获取可用的指标-

// copied from spark git
val predictionAndLabels =
      dataset.select(col($(predictionCol)), col($(labelCol)).cast(DoubleType)).rdd.map {
        case Row(prediction: Double, label: Double) => (prediction, label)
      }
    val metrics = new MulticlassMetrics(predictionAndLabels)

关于apache-spark - Spark ML - MulticlassClassificationEvaluator - 我们可以通过每个类标签获得精度/召回率吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41351711/

上一篇：matrix - 在神经网络中实现偏差的正确方法

下一篇：vector - 机器学习中的向量是什么

apache-spark - Spark Streaming 中的序列化问题

apache-spark - 从 Nexus 获取 Spark 作业 jar

python - "segmentation fault (core dumped)"，当尝试从终端运行 Tensorboard 时

machine-learning - 作为正则化，Vowpal Wabbit 哈希冲突比 L1 效果更好

python - 如何将 Vector 拆分为列 - 使用 PySpark

scala - 无法在简单示例上从 spark ML 运行 RandomForestClassifier

scala - Spark数据帧中两行之间的差异

scala - 如何在Spark ML中为分类创建正确的数据框

scala - Spark build.sbt 文件版本控制