python-2.7 - 将 sklearn2pmml 生成的 .pmml 导入 ScikitLearn 或 Python

标签 python-2.7 scikit-learn pmml

抱歉,如果这可能已经在某处得到了回答,但我一直在寻找大约一个小时,但找不到好的答案。

我有一个在 Scikit-Learn 中训练的简单逻辑回归模型,我将其导出到 .pmml 文件。

  from sklearn2pmml import PMMLPipeline, sklearn2pmml
  my_pipeline = PMMLPipeline(
  ( classifier", LogisticRegression() )
      )
  my_pipeline.fit(blah blah)
  sklearn2pmml(my_pipeline, "filename.pmml")

等等....

所以我想知道是否/如何将这个文件导入回 Python(最好是 2.7)或 Scikit-Learn,就像我在 Java/Scala 中那样使用。类似的东西
"import (filename.pmml) as pm pm.predict(data)
谢谢你的帮助!

最佳答案

Scikit-learn 不提供对导入 PMML 文件的支持,因此恐怕无法完成您要实现的目标。

使用库的概念如 sklearn2pmml实际上是扩展了 sklearn 在支持将模型导出为 PMML 格式时所没有的功能。

通常,那些使用 sklearn2pmml 的人真的希望在其他平台(例如 IBM 的 SPSS、Apache Spark ML、Weka 或任何其他消费者 as listed 数据挖掘组网站)中重用 PMML 模型。

如果您希望保存使用 scikit-learn 创建的模型,然后再使用 scikit-learn 重新使用它,那么您应该探索其名为 Pickle 的原生持久性模型机制,它使用二进制数据格式。

您可以阅读更多关于如何以 Pickle 格式保存/加载模型(连同其已知问题)here .

关于python-2.7 - 将 sklearn2pmml 生成的 .pmml 导入 ScikitLearn 或 Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46255229/

相关文章:

python - 组合元组以形成列表

python - Paramiko/scp - 检查远程主机上是否存在文件

Python:展平对象列表

python - 用 Python 解释决策树

macos - mac OSX 10.8.3 文件系统上的 gae 本地数据存储在哪里?

python - 将 coef 拆分为适用于多类的数组

machine-learning - 如何使用整个训练示例来估计 sklearn RandomForest 中的类概率

r - 无法在 Ubuntu 上安装 'XML' 的 'pmml' 软件包依赖项

java - 在Apache Spark上运行JPMML时出现UnmarshalException

r - 如何在 R 中导出时间序列模型?