<分区>
我很困惑何时使用 Cascading 框架以及何时使用 Apache Spark。每个都有哪些合适的用例?
感谢任何帮助。
<分区>
我很困惑何时使用 Cascading 框架以及何时使用 Apache Spark。每个都有哪些合适的用例?
感谢任何帮助。
最佳答案
本质上,Cascading 是在 MapReduce 等执行引擎之上的高级 API。它在这个意义上类似于 Apache Crunch。 Cascading 还有一些其他相关项目,例如 Scala 版本 (Scalding) 和 PMML 评分 (Pattern)。
Apache Spark 在某种意义上是相似的,它公开了一个用于数据管道的高级 API,并且在 Java 和 Scala 中可用。
它更像是一个执行引擎本身,而不是一层之上的一层。它有许多相关项目,如 MLlib、Streaming、GraphX,用于 ML、流处理、图形计算。
总的来说,我发现现在的 Spark 更有趣了,但它们并不完全相同。
关于java - Apache Spark 还是级联框架?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25240679/