抱歉,如果这可能已经在某处得到了回答,但我一直在寻找大约一个小时,但找不到好的答案。
我有一个在 Scikit-Learn 中训练的简单逻辑回归模型,我将其导出到 .pmml 文件。
from sklearn2pmml import PMMLPipeline, sklearn2pmml
my_pipeline = PMMLPipeline(
( classifier", LogisticRegression() )
)
my_pipeline.fit(blah blah)
sklearn2pmml(my_pipeline, "filename.pmml")
等等....
所以我想知道是否/如何将这个文件导入回 Python(最好是 2.7)或 Scikit-Learn,就像我在 Java/Scala 中那样使用。类似的东西
"import (filename.pmml) as pm
pm.predict(data)
谢谢你的帮助!
最佳答案
Scikit-learn 不提供对导入 PMML 文件的支持,因此恐怕无法完成您要实现的目标。
使用库的概念如 sklearn2pmml实际上是扩展了 sklearn 在支持将模型导出为 PMML 格式时所没有的功能。
通常,那些使用 sklearn2pmml 的人真的希望在其他平台(例如 IBM 的 SPSS、Apache Spark ML、Weka 或任何其他消费者 as listed 数据挖掘组网站)中重用 PMML 模型。
如果您希望保存使用 scikit-learn 创建的模型,然后再使用 scikit-learn 重新使用它,那么您应该探索其名为 Pickle 的原生持久性模型机制,它使用二进制数据格式。
您可以阅读更多关于如何以 Pickle 格式保存/加载模型(连同其已知问题)here .
关于python-2.7 - 将 sklearn2pmml 生成的 .pmml 导入 ScikitLearn 或 Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46255229/