从查询优化器将工作分配到并行计算的服务器之间的工作的意义上讲,类似于Windows Azure SQL Database或AWS Big Data之类的云服务提供的数据库是否能够进行分布式计算?
我没有在Azure documentation中找到任何有关这种查询优化的信息,尽管PDW似乎可以做到这一点。
最佳答案
AWS拥有EMR(Elastic Map-Reduce),这是由AWS提供的Hadoop。
Azure具有安装在Windows VM上的Hortonwork的数据平台(Hadoop)HDInsights。
据我所知,Microsoft的PDW(并行数据仓库)不支持map-reduce,但他们正在对其进行操作(http://www.zdnet.com/microsofts-polybase-mashes-up-sql-server-and-hadoop-7000007424/)-PDW本质上是一些具有中央管理层的SQL Server计算机,该服务器允许对磁盘进行分区和分发不同节点之间的数据-如果数据驻留在多个节点上,但并行性本质上不是map-reduce的,它将并且将中断PDW节点之间的查询。
关于database - 比较MapReduce与云数据库服务,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16771971/