r - 是否可以将 Spark 中的 data.table 与 Spark Dataframes 一起使用？

情况

我曾经使用 data.table 而不是 plyr 或 sqldf 在 Rstudio 上工作，因为它非常快。现在，我正在一个 azure 集群上研究 sparkR，如果我可以在我的 spark 数据帧上使用 data.table 并且它是否比 sql 快，我想现在这样做？

最佳答案

这不可能。 SparkDataFrames是具有瘦 R 接口(interface)的 Java 对象。虽然在某些有限的情况下(dapply、gapply)可以使用工作端 R，但 data.table 没有用处。那里。

关于r - 是否可以将 Spark 中的 data.table 与 Spark Dataframes 一起使用？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47202017/

相关文章：

r - 以 R 格式导出 JSON 数据框