hadoop - 如何将hadoop集群与应用服务器集成?

标签 hadoop integration hbase backend

我有各种应用程序服务器(例如 Web 应用程序),我也一直在使用 Hadoop 和 Hbase、Impala、Hive 等。我可以使用命令行或使用 Hue 等 Web 界面获得我正在寻找的结果。

现在如何将 Hadoop 作为后端与当前应用程序集成,以取代 MySQL、MSSQL、Oracle 等后端解决方案?

p.s 我知道很多都是使用 hadoop 进行批处理,但 HBase 确实提供了一些近乎实时的分析。即使是批处理,我也想让用户开始一些分析并返回并在我自己的前端应用程序中查看结果。

最佳答案

每个框架都提供多个接口(interface)和自己的 API,但彼此不兼容。看看Spring Data这使得使用多个数据库(RDBMS 和 NoSQL)变得容易。这里 ( 1 , 2 ) 是一些关于 Spring Data 的书籍。

我没有关注 Spring Data,所以不确定它周围的社区有多活跃。也许有人可以对此进行补充。

关于hadoop - 如何将hadoop集群与应用服务器集成?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23253816/

相关文章:

python - 获取 SalesforceMalformedRequest : Malformed request error

hadoop - 使用多个输出将输出写入 hbase 表和文件

hadoop - Configuration.deprecation : hadoop. native.lib 已弃用。相反,使用 io.native.lib.available

hadoop - AWS 上的 MapReduce

java - 使用 MapReduce 将 CSV 文件加载到 Hbase 表中

python - spark 1.3.0、python、avro 文件、在 spark-defaults.conf 中设置的驱动程序类路径,但从属设备看不到

java - Hadoop: reducer 的数量不等于我在程序中设置的数量

maven-2 - ant/maven 集成

AZURE DATA FACTORY - 系统找不到输入的环境选项

java - 无法提交并发的Hadoop作业