在尝试使用 pmml 包将 R 分类器导出到 PMML 时,我注意到树中节点的类分布未导出。
PMML 通过 ScoreDistribution 元素支持此功能: http://www.dmg.org/v1-1/treemodel.html
PMML 中是否有此信息?我想使用另一个依赖于此信息的工具来读取 PMML。
我正在做类似的事情:
library(randomForest)
library(pmml)
iris.rf <- randomForest(Species ~ ., data=iris, importance=TRUE,proximity=TRUE)
pmml(iris.rf)
最佳答案
您能否提供更多信息……例如您尝试使用哪个功能。
例如,如果您使用 randomForest 包,我相信它不会提供有关分数分布的信息; PMML 表示也不能。但是,如果您使用默认值,则用于分类的参数“nodesize”等于 1,这意味着终端节点将具有 ScoreDistribution,例如:
ScoreDistribution value=predictedValueprobability="1.0"/>
ScoreDistribution 值=AnyOtherTargetCategoty 概率=“0.0”/>
如果您使用的是 rpart 树模型,pmml 函数会输出分数分布信息。也许您可以向我们提供您使用的确切命令?
关于R PMML 类分布,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21994430/