R PMML 类分布

标签 r random-forest treemodel pmml

在尝试使用 pmml 包将 R 分类器导出到 PMML 时,我注意到树中节点的类分布未导出。

PMML 通过 ScoreDistribution 元素支持此功能: http://www.dmg.org/v1-1/treemodel.html

PMML 中是否有此信息?我想使用另一个依赖于此信息的工具来读取 PMML。

我正在做类似的事情:

library(randomForest)
library(pmml)

iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE,proximity=TRUE)
pmml(iris.rf)

最佳答案

您能否提供更多信息……例如您尝试使用哪个功能。

例如,如果您使用 randomForest 包,我相信它不会提供有关分数分布的信息; PMML 表示也不能。但是,如果您使用默认值,则用于分类的参数“nodesize”等于 1,这意味着终端节点将具有 ScoreDistribution,例如:

ScoreDistribution value=predictedValueprobability="1.0"/>

ScoreDistribution 值=AnyOtherTargetCategoty 概率=“0.0”/>

如果您使用的是 rpart 树模型,pmml 函数会输出分数分布信息。也许您可以向我们提供您使用的确切命令?

关于R PMML 类分布,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21994430/

相关文章:

R如何将数据框转换为单行

r - 在函数内部使用 `setkey()`

python - 如何访问 Spark RandomForest 中的单个预测?

java - 如何获取 JTree 根节点的文件系统路径?

java - 如何克隆java TreeModel?

r - 如何从字符串中提取数字

python - 从python中的 Pandas 系列中删除元素

python - 随机森林中的 class_weight 超参数改变混淆矩阵中的样本量

r - 随机森林输出解释

Java:如何在 JTree 中显示 XML 文件