Make XactLockTableWait work for transactions that are not yet self-locked
authorAlvaro Herrera
Wed, 3 Jan 2018 15:36:47 +0000 (12:36 -0300)
committerAlvaro Herrera
Wed, 3 Jan 2018 17:38:39 +0000 (14:38 -0300)
commitfe6bdc0a38c7bdb8d94f720f7a33cfee87458f6d
tree51e4dac33bfeb97eed2f7328629d57df8ddc18df
parentaa7d71be4b935cd959b19b1e112792981edcdc15
Make XactLockTableWait work for transactions that are not yet self-locked

XactLockTableWait assumed that its xid argument has already added itself
to the lock table.  That assumption led to another assumption that if
locking the xid has succeeded but the xid is reported as still in
progress, then the input xid must have been a subtransaction.

These assumptions hold true for the original uses of this code in
locking related to on-disk tuples, but they break down in logical
replication slot snapshot building -- in particular, when a standby
snapshot logged contains an xid that's already in ProcArray but not yet
in the lock table.  This leads to assertion failures that can be
reproduced all the way back to 9.4, when logical decoding was
introduced.

To fix, change SubTransGetParent to SubTransGetTopmostTransaction which
has a slightly different API: it returns the argument Xid if there is no
parent, and it goes all the way to the top instead of moving up the
levels one by one.  Also, to avoid busy-waiting, add a 1ms sleep to give
the other process time to register itself in the lock table.

For consistency, change ConditionalXactLockTableWait the same way.

Author: Petr Jelínek
Discussion: https://postgr.es/m/1B3E32D8-FCF4-40B4-AEF9-5C0E3AC57969@postgrespro.ru
Reported-by: Konstantin Knizhnik
Diagnosed-by: Stas Kelvich, Petr Jelínek
Reviewed-by: Andres Freund, Robert Haas
src/backend/storage/lmgr/lmgr.c