Fix failure to validate the result of select_common_type().
authorTom Lane
Sat, 29 Jan 2022 16:41:12 +0000 (11:41 -0500)
committerTom Lane
Sat, 29 Jan 2022 16:41:12 +0000 (11:41 -0500)
Although select_common_type() has a failure-return convention, an
apparent successful return just provides a type OID that *might* work
as a common supertype; we've not validated that the required casts
actually exist.  In the mainstream use-cases that doesn't matter,
because we'll proceed to invoke coerce_to_common_type() on each input,
which will fail appropriately if the proposed common type doesn't
actually work.  However, a few callers didn't read the (nonexistent)
fine print, and thought that if they got back a nonzero OID then the
coercions were sure to work.

This affects in particular the recently-added "anycompatible"
polymorphic types; we might think that a function/operator using
such types matches cases it really doesn't.  A likely end result
of that is unexpected "ambiguous operator" errors, as for example
in bug #17387 from James Inform.  Another, much older, case is that
the parser might try to transform an "x IN (list)" construct to
a ScalarArrayOpExpr even when the list elements don't actually have
a common supertype.

It doesn't seem desirable to add more checking to select_common_type
itself, as that'd just slow down the mainstream use-cases.  Instead,
write a separate function verify_common_type that performs the
missing checks, and add a call to that where necessary.  Likewise add
verify_common_type_from_oids to go with select_common_type_from_oids.

Back-patch to v13 where the "anycompatible" types came in.  (The
symptom complained of in bug #17387 doesn't appear till v14, but
that's just because we didn't get around to converting || to use
anycompatible till then.)  In principle the "x IN (list)" fix could
go back all the way, but I'm not currently convinced that it makes
much difference in real-world cases, so I won't bother for now.

Discussion: https://postgr.es/m/17387-5dfe54b988444963@postgresql.org

src/backend/parser/parse_coerce.c
src/backend/parser/parse_expr.c
src/include/parser/parse_coerce.h
src/test/regress/expected/arrays.out
src/test/regress/expected/expressions.out
src/test/regress/sql/arrays.sql
src/test/regress/sql/expressions.sql

index 70466153d9d09b19351f8930640a5a67c6aaed48..e914f8ac8be7ed7564874106ecc3b6e7a00cd5f8 100644 (file)
@@ -1295,6 +1295,10 @@ parser_coercion_errposition(ParseState *pstate,
  * rather than throwing an error on failure.
  * 'which_expr': if not NULL, receives a pointer to the particular input
  * expression from which the result type was taken.
+ *
+ * Caution: "failure" just means that there were inputs of different type
+ * categories.  It is not guaranteed that all the inputs are coercible to the
+ * selected type; caller must check that (see verify_common_type).
  */
 Oid
 select_common_type(ParseState *pstate, List *exprs, const char *context,
@@ -1423,6 +1427,10 @@ select_common_type(ParseState *pstate, List *exprs, const char *context,
  * earlier entries in the array have some preference over later ones.
  * On failure, return InvalidOid if noerror is true, else throw an error.
  *
+ * Caution: "failure" just means that there were inputs of different type
+ * categories.  It is not guaranteed that all the inputs are coercible to the
+ * selected type; caller must check that (see verify_common_type_from_oids).
+ *
  * Note: neither caller will pass any UNKNOWNOID entries, so the tests
  * for that in this function are dead code.  However, they don't cost much,
  * and it seems better to keep this logic as close to select_common_type()
@@ -1545,6 +1553,48 @@ coerce_to_common_type(ParseState *pstate, Node *node,
    return node;
 }
 
+/*
+ * verify_common_type()
+ *     Verify that all input types can be coerced to a proposed common type.
+ *     Return true if so, false if not all coercions are possible.
+ *
+ * Most callers of select_common_type() don't need to do this explicitly
+ * because the checks will happen while trying to convert input expressions
+ * to the right type, e.g. in coerce_to_common_type().  However, if a separate
+ * check step is needed to validate the applicability of the common type, call
+ * this.
+ */
+bool
+verify_common_type(Oid common_type, List *exprs)
+{
+   ListCell   *lc;
+
+   foreach(lc, exprs)
+   {
+       Node       *nexpr = (Node *) lfirst(lc);
+       Oid         ntype = exprType(nexpr);
+
+       if (!can_coerce_type(1, &ntype, &common_type, COERCION_IMPLICIT))
+           return false;
+   }
+   return true;
+}
+
+/*
+ * verify_common_type_from_oids()
+ *     As above, but work from an array of type OIDs.
+ */
+static bool
+verify_common_type_from_oids(Oid common_type, int nargs, const Oid *typeids)
+{
+   for (int i = 0; i < nargs; i++)
+   {
+       if (!can_coerce_type(1, &typeids[i], &common_type, COERCION_IMPLICIT))
+           return false;
+   }
+   return true;
+}
+
 /*
  * check_generic_type_consistency()
  *     Are the actual arguments potentially compatible with a
@@ -1791,7 +1841,13 @@ check_generic_type_consistency(const Oid *actual_arg_types,
                                         true);
 
        if (!OidIsValid(anycompatible_typeid))
-           return false;       /* there's no common supertype */
+           return false;       /* there's definitely no common supertype */
+
+       /* We have to verify that the selected type actually works */
+       if (!verify_common_type_from_oids(anycompatible_typeid,
+                                         n_anycompatible_args,
+                                         anycompatible_actual_types))
+           return false;
 
        if (have_anycompatible_nonarray)
        {
@@ -2222,6 +2278,14 @@ enforce_generic_type_consistency(const Oid *actual_arg_types,
                                             anycompatible_actual_types,
                                             false);
 
+           /* We have to verify that the selected type actually works */
+           if (!verify_common_type_from_oids(anycompatible_typeid,
+                                             n_anycompatible_args,
+                                             anycompatible_actual_types))
+               ereport(ERROR,
+                       (errcode(ERRCODE_DATATYPE_MISMATCH),
+                        errmsg("arguments of anycompatible family cannot be cast to a common type")));
+
            if (have_anycompatible_array)
            {
                anycompatible_array_typeid = get_array_type(anycompatible_typeid);
index f69976cc8c989b0021dd677e0051e87de172322e..0d108d0951698ec6342e4f225ffeae39bfca03c2 100644 (file)
@@ -1283,6 +1283,11 @@ transformAExprIn(ParseState *pstate, A_Expr *a)
        allexprs = list_concat(list_make1(lexpr), rnonvars);
        scalar_type = select_common_type(pstate, allexprs, NULL, NULL);
 
+       /* We have to verify that the selected type actually works */
+       if (OidIsValid(scalar_type) &&
+           !verify_common_type(scalar_type, allexprs))
+           scalar_type = InvalidOid;
+
        /*
         * Do we have an array type to use?  Aside from the case where there
         * isn't one, we don't risk using ScalarArrayOpExpr when the common
index 8686eaacbc9bbd9b870157ca8d47d56793e7206d..9481d8077e77eefb43ade74439cf585703ff8694 100644 (file)
@@ -70,6 +70,7 @@ extern Oid    select_common_type(ParseState *pstate, List *exprs,
 extern Node *coerce_to_common_type(ParseState *pstate, Node *node,
                                   Oid targetTypeId,
                                   const char *context);
+extern bool verify_common_type(Oid common_type, List *exprs);
 
 extern bool check_generic_type_consistency(const Oid *actual_arg_types,
                                           const Oid *declared_arg_types,
index c730563f0386ca593c0f894a9f596de86ab833e2..db46a965c575465f6582a2d248e1e4272c8b6f81 100644 (file)
@@ -726,6 +726,18 @@ SELECT 0 || ARRAY[1,2] || 3 AS "{0,1,2,3}";
  {0,1,2,3}
 (1 row)
 
+SELECT array_agg(x) || array_agg(x) FROM (VALUES (ROW(1,2)), (ROW(3,4))) v(x);
+             ?column?              
+-----------------------------------
+ {"(1,2)","(3,4)","(1,2)","(3,4)"}
+(1 row)
+
+SELECT ROW(1,2) || array_agg(x) FROM (VALUES (ROW(3,4)), (ROW(5,6))) v(x);
+         ?column?          
+---------------------------
+ {"(1,2)","(3,4)","(5,6)"}
+(1 row)
+
 SELECT * FROM array_op_test WHERE i @> '{32}' ORDER BY seqno;
  seqno |                i                |                                                                 t                                                                  
 -------+---------------------------------+------------------------------------------------------------------------------------------------------------------------------------
index 5ade7ccc4d1cbdd005881e9ab144502c02a6fa08..550d557cb3a477b02e9c37e1b1f40798c1a69039 100644 (file)
@@ -231,3 +231,33 @@ explain (verbose, costs off) select * from bpchar_view
 (3 rows)
 
 rollback;
+--
+-- Ordinarily, IN/NOT IN can be converted to a ScalarArrayOpExpr
+-- with a suitably-chosen array type.
+--
+explain (verbose, costs off)
+select random() IN (1, 4, 8.0);
+                         QUERY PLAN                         
+------------------------------------------------------------
+ Result
+   Output: (random() = ANY ('{1,4,8}'::double precision[]))
+(2 rows)
+
+explain (verbose, costs off)
+select random()::int IN (1, 4, 8.0);
+                                QUERY PLAN                                 
+---------------------------------------------------------------------------
+ Result
+   Output: (((random())::integer)::numeric = ANY ('{1,4,8.0}'::numeric[]))
+(2 rows)
+
+-- However, if there's not a common supertype for the IN elements,
+-- we should instead try to produce "x = v1 OR x = v2 OR ...".
+-- In most cases that'll fail for lack of all the requisite = operators,
+-- but it can succeed sometimes.  So this should complain about lack of
+-- an = operator, not about cast failure.
+select '(0,0)'::point in ('(0,0,0,0)'::box, point(0,0));
+ERROR:  operator does not exist: point = box
+LINE 1: select '(0,0)'::point in ('(0,0,0,0)'::box, point(0,0));
+                              ^
+HINT:  No operator matches the given name and argument types. You might need to add explicit type casts.
index 25dd4e2c6dedd0ea89ad1ecdaf9fd3e9184bcd4d..bf9319c704316941ec5c4d4e9a11eb3ee6d248fb 100644 (file)
@@ -311,6 +311,8 @@ SELECT ARRAY[[['hello','world']]] || ARRAY[[['happy','birthday']]] AS "ARRAY";
 SELECT ARRAY[[1,2],[3,4]] || ARRAY[5,6] AS "{{1,2},{3,4},{5,6}}";
 SELECT ARRAY[0,0] || ARRAY[1,1] || ARRAY[2,2] AS "{0,0,1,1,2,2}";
 SELECT 0 || ARRAY[1,2] || 3 AS "{0,1,2,3}";
+SELECT array_agg(x) || array_agg(x) FROM (VALUES (ROW(1,2)), (ROW(3,4))) v(x);
+SELECT ROW(1,2) || array_agg(x) FROM (VALUES (ROW(3,4)), (ROW(5,6))) v(x);
 
 SELECT * FROM array_op_test WHERE i @> '{32}' ORDER BY seqno;
 SELECT * FROM array_op_test WHERE i && '{32}' ORDER BY seqno;
index 09b67aafc552e0035aceac5d07341def7713a003..86f20ef55c85e6472617e4d84e950b75ae5abdd8 100644 (file)
@@ -101,3 +101,19 @@ explain (verbose, costs off) select * from bpchar_view
   where f1::bpchar = 'foo';
 
 rollback;
+
+
+--
+-- Ordinarily, IN/NOT IN can be converted to a ScalarArrayOpExpr
+-- with a suitably-chosen array type.
+--
+explain (verbose, costs off)
+select random() IN (1, 4, 8.0);
+explain (verbose, costs off)
+select random()::int IN (1, 4, 8.0);
+-- However, if there's not a common supertype for the IN elements,
+-- we should instead try to produce "x = v1 OR x = v2 OR ...".
+-- In most cases that'll fail for lack of all the requisite = operators,
+-- but it can succeed sometimes.  So this should complain about lack of
+-- an = operator, not about cast failure.
+select '(0,0)'::point in ('(0,0,0,0)'::box, point(0,0));