例如,我想从运行在远程hadoop集群上的h2o flow
导出模型(而不是POJO),以便可以将其上载到本地计算机h2o session 并查看输出指标,而无需再次训练模型。相同的数据。但是,当我尝试从flow
(以“export_test”命名)导出模型时,找不到它。要开始h2o session ,我正在做:
$cd cd h2o-3.14.0.6-mapr5.2
$hadoop jar h2odriver.jar -nodes 5 -mapperXmx 6g -output hdfsOutputDirName
但是我在hdfsOutputDirName或h2o-3.14.0.6-mapr5.2目录(这是在本地计算机上使用
flow
导出模型时在其中存储模型的地方)中都看不到任何名为“export_test”的文件,所以我我不确定会去哪里。是否有默认的基本目录,h2o流可能会导出到我远程访问的节点上的某个地方(如baseDir / export_test)?谢谢。
最佳答案
将相对于您正在与之交谈的特定节点的运行位置保存模型。因此,在主机上的本地文件系统上,放置了REST API客户端(例如R,Python或H2O Flow)正在与YARN容器通信的主机。
这可能不是您要保存模型的地方。
您可以显式指定“hdfs://”路径以将模型保存到该路径,然后在hdfs中找到它。
[该“-output hdfsOutputDirName”实际上是从org.apache.hadoop.util.ToolRunner继承的产物,没有任何用处。 ]
关于hadoop - H2O Flow UI导出到的根目录是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44966134/