我正在设计一个分析系统的架构。我有一个在 scikit learn 中开发的分类集成模型。我想将其移至生产环境,以便可以使用此模型对新传入的数据进行动态分类。理想情况下,系统应支持将“模型”手动上传到生产系统中。我没有任何分析生产系统的经验。任何建议都会非常有帮助
我已经检查了 Py2PMML 但它不支持所有模型。 我主要是在寻找增强树回归。 PS:我不是要代码或示例。方向正确。
最佳答案
目前没有 official way将 scikit 模型导出到 PMML。推荐的方法是使用 pickle 或 joblib.dump。请引用model persistence文档的部分。这个想法是将模型保存到磁盘:
>>> from sklearn.externals import joblib
>>> joblib.dump(model, 'saved_model.pkl')
然后将其上传到生产中的服务器并加载:
>>> model = joblib.load('saved_model.pkl')
尝试拥有类似的环境非常重要,在一个版本的 scikit-learn 中保存的模型可能无法在另一版本中加载。
关于python - 将分类移至生产环境,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28097247/