python - 如何在纯Python中运行spark mllib决策树模型?

标签 python apache-spark decision-tree pmml

我想使用 Spark 构建模型(特别是决策树),然后使用纯 Python(不是 pyspark)应用程序应用它们

看来 PMML 导出是预期的方法,但树模型尚不支持它,而且我没有找到似乎正在积极开发的 Python PMML 库

最佳答案

Augustus 已不再开发,地址为 https://code.google.com/p/augustus/ 。最近,有支持 scikitlearn pmml 导入/导出的工作,地址:https://github.com/alex-pirozhenko/sklearn-pmml这可能是一个选择。

正如 @zero323 所指出的,PMML 导出仅适用于某些型号。对于其他模型,如果您针对特定的服务平台,您可以编写自己的自定义导出代码或编写自己的解析代码(对于决策树来说,是以自定义 parquet 格式编写的)。

关于python - 如何在纯Python中运行spark mllib决策树模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32574143/

相关文章:

python - Django:测试应用程序导致 Tastypie 错误

python - 使用 python-wnck 生成和移动后窗口位置稍微偏离

apache-spark - 如何使用 spark 数据框评估 spark Dstream 对象

python - 如何从 scikit-learn 解释决策树

python - Scikit Learn - 决策树 - 每条记录结果的视觉表示

python - 如何动态地将数据从列表添加到数据库(PostgreSQL)

python - Psycopg2:使用 with ... as 在 python 中进行查询

java - Apache Spark : How can i access nested array of integers within Tuple2 object in Java?

hadoop - 如何在Spark而不是RAM的磁盘上进行计算?

machine-learning - 使用决策树提升和概念层次结构的重要性