在寻找使用 Mongo API 将本地 MongoDB 迁移到 Azure CosmosDB 的服务时,我们遇到了名为 Azure Data Bricks 的服务。我们总共有 186GB 的数据。我们需要以尽可能少的停机时间迁移到 CosmosDB。我们如何才能提高数据传输速率呢?如果有人可以对 Azure 提供的基于 Spark 的 PaaS 提供一些见解,那将会非常有帮助。 谢谢
最佳答案
您是否引用了我们文档中给出的文章 page ?
通常,您可以假设迁移工作负载可以消耗整个配置的吞吐量,配置的吞吐量将给出迁移速度的估计。您可以考虑在迁移时增加 RU,然后再减少。
可以通过以下配置调整迁移性能:
Spark集群中worker和core的数量
maxBatchSize
在数据传输期间禁用索引
关于mongodb - 如何借助 Azure Databricks 高效地将 MongoDB 迁移到 Azure CosmosDB?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69656700/