database - 比较MapReduce与云数据库服务

标签 database hadoop cloud distributed-computing

从查询优化器将工作分配到并行计算的服务器之间的工作的意义上讲,类似于Windows Azure SQL DatabaseAWS Big Data之类的云服务提供的数据库是否能够进行分布式计算?

我没有在Azure documentation中找到任何有关这种查询优化的信息,尽管PDW似乎可以做到这一点。

最佳答案

AWS拥​​有EMR(Elastic Map-Reduce),这是由AWS提供的Hadoop。

Azure具有安装在Windows VM上的Hortonwork的数据平台(Hadoop)HDInsights。

据我所知,Microsoft的PDW(并行数据仓库)不支持map-reduce,但他们正在对其进行操作(http://www.zdnet.com/microsofts-polybase-mashes-up-sql-server-and-hadoop-7000007424/)-PDW本质上是一些具有中央管理层的SQL Server计算机,该服务器允许对磁盘进行分区和分发不同节点之间的数据-如果数据驻留在多个节点上,但并行性本质上不是map-reduce的,它将并且将中断PDW节点之间的查询。

关于database - 比较MapReduce与云数据库服务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16771971/

相关文章:

java - 检查firebase实时数据库中的数据不起作用

scala - 示例Spark程序

streaming - 如何集成Storm和Kafka

deployment - 代码和数据跟踪/部署

hadoop - 流推特数据时出错

azure - 如何在一台服务器上部署多个带有嵌入式tomcat的Spring boot应用程序

安卓 : take Data in ListView

java - 将 MongoDB 集合中的数据复制到 MySQL 表中

mysql - 如何根据另一个表中的 %LIKE% 值过滤一个表

hadoop - 独立处理大量小文件