Improve performance of pullback/pushfwd in regular-expression compiler.
authorTom Lane
Fri, 16 Oct 2015 19:11:49 +0000 (15:11 -0400)
committerTom Lane
Fri, 16 Oct 2015 19:56:00 +0000 (15:56 -0400)
commit1bb0fbca39b447d1ce6da5f6bcf9f468a6346a08
treeefff953b5025a8c2011f71987ef2b3b902a36900
parente9cf3dc30a4ed82f2c284240841678db15491669
Improve performance of pullback/pushfwd in regular-expression compiler.

The previous coding would create a new intermediate state every time it
wanted to interchange the ordering of two constraint arcs.  Certain regex
features such as \Y can generate large numbers of parallel constraint arcs,
and if we needed to reorder the results of that, we created unreasonable
numbers of intermediate states.  To improve matters, keep a list of
already-created intermediate states associated with the state currently
being considered by the outer loop; we can re-use such states to place all
the new arcs leading to the same destination or source.

I also took the trouble to redefine push() and pull() to have a less risky
API: they no longer delete any state or arc that the caller might possibly
have a pointer to, except for the specifically-passed constraint arc.
This reduces the risk of re-introducing the same type of error seen in
the failed patch for CVE-2007-4772.

Back-patch to all supported branches.
src/backend/regex/regc_nfa.c
src/backend/regex/regcomp.c