r - H2O 不能从 H2OParsedData 子集列

标签 r hadoop h2o

我将 h2o(2.8.4.4) 用于 R 中的 hadoop。 我想从具有 720512 行和 788 列的数据框中获取一些列。 我这样写:

library("h2o");
localH2O = h2o.init(ip = ipItem, port = 54321, startH2O = F)
waterTrain <- h2o.importFile(localH2O, path=trainName, key="trainKey", parse=T, header=T, sep="*")
subset <- waterTrain[, 1:787]
Error: Expectation failed

我做错了什么?

最佳答案

您可以使用 as.data.frame 方法将 waterTrain 转换为数据框,然后使用标准 R 方法方便地过滤(子集)

waterTrain.data.frame <- as.data.frame(waterTrain)

或者你也可以,

irisPath <- system.file("extdata", "iris.csv", package="h2o")
iris.hex <- h2o.importFile(localH2O, path = irisPath, key = "iris.hex")
iris.hex.top10 <- iris.hex[1:10,1:3]

关于r - H2O 不能从 H2OParsedData 子集列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29828978/

相关文章:

r - 如何将稀疏矩阵转化为H2O?

r - 从R中的国家/地区名称获取大陆名称

随时间序列滚动事件计数

r - 数据框中变量之间的快速成对简单线性回归

python - 将 Hadoop 流作业的输出发送到 STDOUT

java - hadoop 使用类名提交作业,为什么需要 job.setJarByClass()?

r - AWS EC2 上使用 h2o 进行多节点集群安装

r - 使用 `loess.smooth` 但不是 `loess` 或 `lowess` 时出错

hadoop - hadoop 本身是否包含容错故障转移功能?

r - R中的错误Predictor.new()函数包IML