Enable hash partitioning of text arrays

author Peter Eisentraut <peter@eisentraut.org>

Wed, 4 Nov 2020 06:47:06 +0000 (07:47 +0100)

committer Peter Eisentraut <peter@eisentraut.org>

Wed, 4 Nov 2020 11:46:28 +0000 (12:46 +0100)
author Peter Eisentraut <peter@eisentraut.org>
Wed, 4 Nov 2020 06:47:06 +0000 (07:47 +0100)
committer Peter Eisentraut <peter@eisentraut.org>
Wed, 4 Nov 2020 11:46:28 +0000 (12:46 +0100)
diff --git a/src/backend/utils/adt/arrayfuncs.c b/src/backend/utils/adt/arrayfuncs.c

index 392445ea032929e1b734a47cd9ef8856c1eff121..a7ea7656c75d0ab516d47754cec3cbb59ed98e2d 100644 (file)
--- a/src/backend/utils/adt/arrayfuncs.c
+++ b/src/backend/utils/adt/arrayfuncs.c
@@ -4071,7 +4071,7 @@ hash_array_extended(PG_FUNCTION_ARGS)
     typalign = typentry->typalign;
  
     InitFunctionCallInfoData(*locfcinfo, &typentry->hash_extended_proc_finfo, 2,
-                            InvalidOid, NULL, NULL);
+                            PG_GET_COLLATION(), NULL, NULL);
  
     /* Loop over source data */
     nitems = ArrayGetNItems(ndims, dims);
diff --git a/src/test/regress/expected/collate.icu.utf8.out b/src/test/regress/expected/collate.icu.utf8.out

index 16b4d9e2cdc6b4c2f435bd9cba36b76e75fc39ec..bc3752e92369ca7d40b8645c318a3ccfa32ea9dd 100644 (file)
--- a/src/test/regress/expected/collate.icu.utf8.out
+++ b/src/test/regress/expected/collate.icu.utf8.out
@@ -1212,6 +1212,30 @@ SELECT * FROM test6 WHERE b = 'äbc' COLLATE ctest_nondet;
   2 | äbc
  (2 rows)
  
+-- same with arrays
+CREATE TABLE test6a (a int, b text[]);
+INSERT INTO test6a VALUES (1, ARRAY[U&'\00E4bc']);
+INSERT INTO test6a VALUES (2, ARRAY[U&'\0061\0308bc']);
+SELECT * FROM test6a;
+ a |   b   
+---+-------
+ 1 | {äbc}
+ 2 | {äbc}
+(2 rows)
+
+SELECT * FROM test6a WHERE b = ARRAY['äbc'] COLLATE ctest_det;
+ a |   b   
+---+-------
+ 1 | {äbc}
+(1 row)
+
+SELECT * FROM test6a WHERE b = ARRAY['äbc'] COLLATE ctest_nondet;
+ a |   b   
+---+-------
+ 1 | {äbc}
+ 2 | {äbc}
+(2 rows)
+
  CREATE COLLATION case_sensitive (provider = icu, locale = '');
  CREATE COLLATION case_insensitive (provider = icu, locale = '@colStrength=secondary', deterministic = false);
  SELECT 'abc' <= 'ABC' COLLATE case_sensitive, 'abc' >= 'ABC' COLLATE case_sensitive;
@@ -1839,6 +1863,19 @@ SELECT (SELECT count(*) FROM test22_0) = (SELECT count(*) FROM test22_1);
   t
  (1 row)
  
+-- same with arrays
+CREATE TABLE test22a (a int, b text[] COLLATE case_sensitive) PARTITION BY HASH (b);
+CREATE TABLE test22a_0 PARTITION OF test22a FOR VALUES WITH (MODULUS 2, REMAINDER 0);
+CREATE TABLE test22a_1 PARTITION OF test22a FOR VALUES WITH (MODULUS 2, REMAINDER 1);
+INSERT INTO test22a VALUES (1, ARRAY['def']);
+INSERT INTO test22a VALUES (2, ARRAY['DEF']);
+-- they end up in different partitions
+SELECT (SELECT count(*) FROM test22a_0) = (SELECT count(*) FROM test22a_1);
+ ?column? 
+----------
+ t
+(1 row)
+
  CREATE TABLE test23 (a int, b text COLLATE case_insensitive) PARTITION BY HASH (b);
  CREATE TABLE test23_0 PARTITION OF test23 FOR VALUES WITH (MODULUS 2, REMAINDER 0);
  CREATE TABLE test23_1 PARTITION OF test23 FOR VALUES WITH (MODULUS 2, REMAINDER 1);
@@ -1851,6 +1888,19 @@ SELECT (SELECT count(*) FROM test23_0) <> (SELECT count(*) FROM test23_1);
   t
  (1 row)
  
+-- same with arrays
+CREATE TABLE test23a (a int, b text[] COLLATE case_insensitive) PARTITION BY HASH (b);
+CREATE TABLE test23a_0 PARTITION OF test23a FOR VALUES WITH (MODULUS 2, REMAINDER 0);
+CREATE TABLE test23a_1 PARTITION OF test23a FOR VALUES WITH (MODULUS 2, REMAINDER 1);
+INSERT INTO test23a VALUES (1, ARRAY['def']);
+INSERT INTO test23a VALUES (2, ARRAY['DEF']);
+-- they end up in the same partition (but it's platform-dependent which one)
+SELECT (SELECT count(*) FROM test23a_0) <> (SELECT count(*) FROM test23a_1);
+ ?column? 
+----------
+ t
+(1 row)
+
  CREATE TABLE test30 (a int, b char(3) COLLATE case_insensitive) PARTITION BY LIST (b);
  CREATE TABLE test30_1 PARTITION OF test30 FOR VALUES IN ('abc');
  INSERT INTO test30 VALUES (1, 'abc');
diff --git a/src/test/regress/sql/collate.icu.utf8.sql b/src/test/regress/sql/collate.icu.utf8.sql

index 4714c044d5316e2b34c864d3db7b7231a1e1f01f..0de2ed8d8565629e6b2d404fa1862241b1279d12 100644 (file)
--- a/src/test/regress/sql/collate.icu.utf8.sql
+++ b/src/test/regress/sql/collate.icu.utf8.sql
@@ -478,6 +478,14 @@ SELECT * FROM test6;
  SELECT * FROM test6 WHERE b = 'äbc' COLLATE ctest_det;
  SELECT * FROM test6 WHERE b = 'äbc' COLLATE ctest_nondet;
  
+-- same with arrays
+CREATE TABLE test6a (a int, b text[]);
+INSERT INTO test6a VALUES (1, ARRAY[U&'\00E4bc']);
+INSERT INTO test6a VALUES (2, ARRAY[U&'\0061\0308bc']);
+SELECT * FROM test6a;
+SELECT * FROM test6a WHERE b = ARRAY['äbc'] COLLATE ctest_det;
+SELECT * FROM test6a WHERE b = ARRAY['äbc'] COLLATE ctest_nondet;
+
  CREATE COLLATION case_sensitive (provider = icu, locale = '');
  CREATE COLLATION case_insensitive (provider = icu, locale = '@colStrength=secondary', deterministic = false);
  
@@ -680,6 +688,15 @@ INSERT INTO test22 VALUES (2, 'DEF');
  -- they end up in different partitions
  SELECT (SELECT count(*) FROM test22_0) = (SELECT count(*) FROM test22_1);
  
+-- same with arrays
+CREATE TABLE test22a (a int, b text[] COLLATE case_sensitive) PARTITION BY HASH (b);
+CREATE TABLE test22a_0 PARTITION OF test22a FOR VALUES WITH (MODULUS 2, REMAINDER 0);
+CREATE TABLE test22a_1 PARTITION OF test22a FOR VALUES WITH (MODULUS 2, REMAINDER 1);
+INSERT INTO test22a VALUES (1, ARRAY['def']);
+INSERT INTO test22a VALUES (2, ARRAY['DEF']);
+-- they end up in different partitions
+SELECT (SELECT count(*) FROM test22a_0) = (SELECT count(*) FROM test22a_1);
+
  CREATE TABLE test23 (a int, b text COLLATE case_insensitive) PARTITION BY HASH (b);
  CREATE TABLE test23_0 PARTITION OF test23 FOR VALUES WITH (MODULUS 2, REMAINDER 0);
  CREATE TABLE test23_1 PARTITION OF test23 FOR VALUES WITH (MODULUS 2, REMAINDER 1);
@@ -688,6 +705,15 @@ INSERT INTO test23 VALUES (2, 'DEF');
  -- they end up in the same partition (but it's platform-dependent which one)
  SELECT (SELECT count(*) FROM test23_0) <> (SELECT count(*) FROM test23_1);
  
+-- same with arrays
+CREATE TABLE test23a (a int, b text[] COLLATE case_insensitive) PARTITION BY HASH (b);
+CREATE TABLE test23a_0 PARTITION OF test23a FOR VALUES WITH (MODULUS 2, REMAINDER 0);
+CREATE TABLE test23a_1 PARTITION OF test23a FOR VALUES WITH (MODULUS 2, REMAINDER 1);
+INSERT INTO test23a VALUES (1, ARRAY['def']);
+INSERT INTO test23a VALUES (2, ARRAY['DEF']);
+-- they end up in the same partition (but it's platform-dependent which one)
+SELECT (SELECT count(*) FROM test23a_0) <> (SELECT count(*) FROM test23a_1);
+
  CREATE TABLE test30 (a int, b char(3) COLLATE case_insensitive) PARTITION BY LIST (b);
  CREATE TABLE test30_1 PARTITION OF test30 FOR VALUES IN ('abc');
  INSERT INTO test30 VALUES (1, 'abc');
author	Peter Eisentraut <peter@eisentraut.org>
	Wed, 4 Nov 2020 06:47:06 +0000 (07:47 +0100)
committer	Peter Eisentraut <peter@eisentraut.org>
	Wed, 4 Nov 2020 11:46:28 +0000 (12:46 +0100)
src/backend/utils/adt/arrayfuncs.c		patch \| blob \| blame \| history
src/test/regress/expected/collate.icu.utf8.out		patch \| blob \| blame \| history
src/test/regress/sql/collate.icu.utf8.sql		patch \| blob \| blame \| history