r - Spark R - Spark R 中的 `factors()` 是什么?

标签 r apache-spark sparkr

在 R 中,我们有函数 factors()。我想通过 Spark R 以并行方式使用此函数。

我的 Spark 版本是 1.6.2,我在 documentation 中找不到对应的版本.我以为我可以用 map 来做,但我不确定我是否理解 this answer ,应该有更简单的方法。

简单来说:Spark R 中的 factors() 是什么?

最佳答案

没有直接的等价物。 Spark 使用 double 字对每种类型的变量进行编码,并使用元数据来区分不同类型。对于 ML 算法,您可以使用自动对列进行编码的公式。

关于r - Spark R - Spark R 中的 `factors()` 是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38465479/

相关文章:

R 和堆积面积图?

scala - 计算余弦相似度 Spark Dataframe

apache-spark - Spark - UbuntuVM - Java 运行时环境内存不足

apache-spark - org.apache.zeppelin.interpreter.InterpreterException:Sparkr没有响应

R:找到二维点云的 2 点之间的最短测地路径

r - 如何以编程方式编辑 R markdown YAML header ?

r - DT数据表显示错误

sql - pyspark.sql.functions.window 函数的 'startTime' 参数和 window.start 有什么作用?

r - 将列添加到 sparkR 中的 DataFrame

r - createDataFrame 中的 SparkR 瓶颈?