Citus 分片重新平衡没有进展

标签 citus rebalancing

我有一个包含 3 个工作节点的 Citus 集群,最近添加了一个新工作节点,然后开始对表进行重新平衡。到这里为止一切正常,但再平衡并没有结束。当我看着

get_rebalance_progress()
目标分片大小始终是源分片大小的 %10。我等了 18 个小时,但没有任何进展。也没有错误。

该表有 32 个分片和 1200 个分区。每分钟插入 25k 行。没有删除或更新。它今天(2022-08-10)只有 10 天的数据。 开始重新平衡后,我在新节点上看到了一些磁盘和网络事件,但几分钟后它就下降了,之后我看不到任何明显的事件。 我究竟做错了什么?我应该如何重新平衡该表?

最佳答案

如果可能的话,尝试进行写阻塞再平衡:

SELECT rebalance_table_shards('dist_table', shard_transfer_mode:='block_writes');

如果操作仍然卡住,查看工作人员和协调员的日志以了解任何与重新平衡相关的错误/信息可能有助于您了解导致问题的原因。

或者,如果您还没有更新到最新的 citus 版本,请考虑更新到最新的 citus 版本,因为重新平衡操作已经有了改进。

您应该可以通过以下方式进行更新:https://www.citusdata.com/blog/2022/06/17/citus-11-goes-fully-open-source/

关于Citus 分片重新平衡没有进展,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/73301229/

相关文章:

mysql - 使用 MySQL/InnoDB 重新平衡表分片

apache-kafka - 消费者 'group_name' 组永远重新平衡

json - Postgres 集群 (citus) : Range Query on nested jsonb column

postgresql - 从 Azure CLI(不是 ARC)创建 PostgreSQL 超大规模 Citus DB

postgresql - Citus 上的主键(UUID、序列)策略

mysql - Citus 是否支持使用 mysql_fdw 创建分片?

postgresql - AWS DMS 任务失败,出现错误 : Error executing source loop; Stream component failed at subtask 0

apache-kafka - Kafka 连接器 - 无法停止重新平衡

metrics - Service Fabric 资源平衡器使用陈旧的报告负载

Kubernetes - 触发 Pod 的重新平衡