Fix JSON error reporting for many cases of erroneous string values.
authorTom Lane <tgl@sss.pgh.pa.us>
Mon, 13 Mar 2023 19:19:00 +0000 (15:19 -0400)
committerTom Lane <tgl@sss.pgh.pa.us>
Mon, 13 Mar 2023 19:19:00 +0000 (15:19 -0400)
commit25a7812cd0867043ec0a045c41e6bd3981d69bc4
treeb6072ba81457f86b3aa890baab117ed7f49454db
parent30dbdbe75384bcb034172c781b24bc982434a967
Fix JSON error reporting for many cases of erroneous string values.

The majority of error exit cases in json_lex_string() failed to
set lex->token_terminator, causing problems for the error context
reporting code: it would see token_terminator less than token_start
and do something more or less nuts.  In v14 and up the end result
could be as bad as a crash in report_json_context().  Older
versions accidentally avoided that fate; but all versions produce
error context lines that are far less useful than intended,
because they'd stop at the end of the prior token instead of
continuing to where the actually-bad input is.

To fix, invent some macros that make it less notationally painful
to do the right thing.  Also add documentation about what the
function is actually required to do; and in >= v14, add an assertion
in report_json_context about token_terminator being sufficiently
far advanced.

Per report from Nikolay Shaplov.  Back-patch to all supported
versions.

Discussion: https://postgr.es/m/7332649.x5DLKWyVIX@thinkpad-pgpro
src/backend/utils/adt/jsonfuncs.c
src/common/jsonapi.c
src/test/regress/expected/json_encoding.out
src/test/regress/expected/json_encoding_1.out