hadoop - 如何将hadoop集群与应用服务器集成？

我有各种应用程序服务器(例如 Web 应用程序)，我也一直在使用 Hadoop 和 Hbase、Impala、Hive 等。我可以使用命令行或使用 Hue 等 Web 界面获得我正在寻找的结果。

现在如何将 Hadoop 作为后端与当前应用程序集成，以取代 MySQL、MSSQL、Oracle 等后端解决方案？

p.s 我知道很多都是使用 hadoop 进行批处理，但 HBase 确实提供了一些近乎实时的分析。即使是批处理，我也想让用户开始一些分析并返回并在我自己的前端应用程序中查看结果。

最佳答案

每个框架都提供多个接口(interface)和自己的 API，但彼此不兼容。看看Spring Data这使得使用多个数据库(RDBMS 和 NoSQL)变得容易。这里 ( 1 , 2 ) 是一些关于 Spring Data 的书籍。

我没有关注 Spring Data，所以不确定它周围的社区有多活跃。也许有人可以对此进行补充。

关于hadoop - 如何将hadoop集群与应用服务器集成？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23253816/