apache-spark - Spark ML - MulticlassClassificationEvaluator - 我们可以通过每个类标签获得精度/召回率吗?

标签 apache-spark machine-learning apache-spark-ml multiclass-classification

我正在 Spark ML 中使用随机森林进行多类预测。

对于 Spark ML 中的 MulticlassClassificationEvaluator(),是否可以通过每个类标签获得精度/召回率?

目前,我只看到所有类别的精确度/召回率相结合。

最佳答案

直接使用org.apache.spark.mllib.evaluation.MulticlassMetrics,然后获取可用的指标-

// copied from spark git
val predictionAndLabels =
      dataset.select(col($(predictionCol)), col($(labelCol)).cast(DoubleType)).rdd.map {
        case Row(prediction: Double, label: Double) => (prediction, label)
      }
    val metrics = new MulticlassMetrics(predictionAndLabels)

关于apache-spark - Spark ML - MulticlassClassificationEvaluator - 我们可以通过每个类标签获得精度/召回率吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41351711/

相关文章:

machine-learning - 如何评估特定上下文文件上的 word2vec 构建

apache-spark - Spark Streaming 中的序列化问题

apache-spark - 从 Nexus 获取 Spark 作业 jar

python - "segmentation fault (core dumped)",当尝试从终端运行 Tensorboard 时

machine-learning - 作为正则化,Vowpal Wabbit 哈希冲突比 L1 效果更好

python - 如何将 Vector 拆分为列 - 使用 PySpark

scala - 无法在简单示例上从 spark ML 运行 RandomForestClassifier

scala - Spark数据帧中两行之间的差异

scala - 如何在Spark ML中为分类创建正确的数据框

scala - Spark build.sbt 文件版本控制