hadoop - Spark Controller 和 SAP Vora 之间的区别

标签 hadoop hana data-access vora

我有一个版本为 2 SP 01 的 HANA Express 服务器和一个带有 Hortonworks Data Platform 2.6 的 Hadoop 集群。在 Hadoop 集群上,我安装了 Vora 1.4 和 SparkController 2.1.1。

我看到了以下视频,其中解释了从一个 HANA 版本到另一个版本的更改:https://www.youtube.com/watch?v=-B9LUjt8x2s&list=PLkzo92owKnVxweu0HK_3QjCfHiMn0jIcA%E2%88%88dex=66

在 SPS 10 中,Spark Controller 似乎是 HANA/Hadoop 交互的实际连接器。

但是,有没有可能 Vora 是连接 Hadoop 和 HANA 的实际标准解决方案,而我的环境中不再需要 Spark Controller?还是 Spark Controller 对 Vora 有其他一些优势/功能?

最佳答案

Jason Hinsperger 对我在 HANA 社区 (https://answers.sap.com/questions/252517/difference-between-spark-controller-and-sap-vora.html) 中的其他问题的回答:

The Spark Controller is only required if you are connecting to Hadoop from Hana and are not using SAP Vora.

SAP Vora is an independant, distributed in-memory analytics layer for the data lake, and one of its features is that it provides high performance bi-directional access to Hana (eg. you can query Hadoop data from Hana through Vora, and you can query Hana data from Vora running on Hadoop). Vora also has a bunch of other benefits as well related to analyzing data lakes (enhanced functionality, performance, modelling, data specific query engines, etc...) which is covered in the docs and various marketing materials.

HTH,

--Jason

关于hadoop - Spark Controller 和 SAP Vora 之间的区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45057197/

相关文章:

hadoop - 如何查询制作压缩的parquet文件?

hadoop - 用 pig 散装

hadoop - 使用 du 命令查看 HDFS 文件系统的大小

hadoop - 在Ubuntu上安装Hadoop tar文件和Cloudera VM

sql - HANA While 循环

linq - LinqToSQL 和 Linq 一样吗?

orchardcms - 如何以编程方式从外部访问 Orchard CMS 内容?

SQL 封顶,连续求和

sql - 有什么方法可以更改 HANA DB 中的序列名称吗?

vb.net - 为什么要从 ADO 切换到 ADO.NET?