scala - 如何在终端中打印 ApacheSpark RDD 的内容?

标签 scala matrix apache-spark

这是我第一次在项目中使用 Scala 和 ApacheSpark。当我在终端中运行我的代码时,我试图打印矩阵的内容,但到目前为止我尝试的任何事情都没有奏效。

相反,我只打印了这个:

org.apache.spark.mllib.linalg.distributed.MatrixEntry;@71870da7
org.apache.spark.mllib.linalg.distributed.CoordinateMatrix@1dcca8d3

我只是使用 println(),但是当我使用 collect() 时,结果也不是很好。

最佳答案

默认的 toString 打印类的名称,后跟内存中的地址。

org.apache.spark.mllib.linalg.distributed.MatrixEntry;@71870da7

您将想要找到一种方法来遍历您的矩阵并打印每个元素。

关于scala - 如何在终端中打印 ApacheSpark RDD 的内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37513660/

相关文章:

azure - 无法在 azure synapse Analytics Spark 池上上传工作区包和requirement.txt 文件

scala - scala 中反向排序的最佳方法是什么?

c++ - 从 C++ 类实现二维矩阵

c++ - Word Solver - 所有方向

c++ - Armadillo 和 C++ - 使用二维数组进行矩阵初始化

java - META-INF/spring.factories 中缺少 spring 自动配置类

scala - Spark MLLib线性回归模型截距始终为0.0?

exception - Scala 中的@throws 问题

mysql - 如何修复 INSERT 上返回的单个 AutoInc 列的 Slick 异常

list - 如何将 n 行中的数字读入 Scala 列表?