我有多个进程使用 SERIALIZED 隔离级别插入到 Postgres (10.3) 表中。
我们系统的另一部分需要读取这些记录并确保它按顺序接收所有这些记录。例如,在下图中,消费者需要
select * from table where sequanceNum > 2309 limit 5
然后收到序列号2310、2311、2312、2313和2314。
读取查询正在使用 READCOMMITTED 隔离级别。
但我看到的是阅读查询只接收我用黄色突出显示的行。查看 xmin,我猜测事务 334250 已经开始但尚未完成,然后事务 334251、334252 等在我的阅读查询开始之前开始并完成。
我的问题是,他们是如何在 334250 的序列号中插入序列号的?为什么这些事务没有被所有正在序列化的写入事务的优点阻止?
关于如何实现我所追求的目标有什么建议吗?也就是说,保证不同的交易不会生成交错的序列号? (如果有间隙也没关系....但它们不能交错)。
非常感谢您的帮助。我正在为这个掉头发!
PS - 我刚刚注意到 334250 有一个非零的 xmax。这可能是我遗漏的线索吗?
最佳答案
SQL 标准通常将 SERIALIZABLE
定义为:
The execution of concurrent SQL-transactions at isolation level
SERIALIZABLE
is guaranteed to be serializable. A serializable execution is defined to be an execution of the operations of concurrently executing SQL-transactions that produces the same effect as some serial execution of those same SQL-transactions. A serial execution is one in which each SQL-transaction executes to completion before the next SQL-transaction begins.
根据这个定义,我理解你的愿望是序列号与“产生相同效果”的“串行执行”的顺序相同。
不幸的是,在交易开始时等效的序列顺序并不清楚,因为交易中后面的语句可以确定交易的“逻辑”顺序。
另一方面,序列号是根据请求号码时的挂钟时间排序的。
在某种程度上,您需要由事务提交前不确定的事物确定的序列号,这在术语上是矛盾的。
所以我认为不可能得到你想要的,除非你实际序列化执行,例如通过在插入数据之前以 SHARE ROW EXCLUSIVE
模式锁定表。
我的问题是为什么您有这种不寻常的需求。我想不出一个好的理由。
关于PostgreSQL 序列化插入交错序列号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52432459/