情况
我曾经使用 data.table 而不是 plyr 或 sqldf 在 Rstudio 上工作,因为它非常快。现在,我正在一个 azure 集群上研究 sparkR,如果我可以在我的 spark 数据帧上使用 data.table 并且它是否比 sql 快,我想现在这样做?
最佳答案
这不可能。 SparkDataFrames
是具有瘦 R 接口(interface)的 Java 对象。虽然在某些有限的情况下(dapply
、gapply
)可以使用工作端 R,但 data.table
没有用处。那里。
关于r - 是否可以将 Spark 中的 data.table 与 Spark Dataframes 一起使用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47202017/