字符类型表达式的字符集和字符序

每一个字符类型的表达式含有字符集和字符序属性。

在B模式的数据库下,如果将系统参数b_format_behavior_compat_options设置含有enable_multi_charset选项, 字符串常量的默认字符集与字符序由系统参数character_set_connectioncollation_connection决定。否则,其默认字符集与数据库字符集server_encoding相同,其默认字符序为default

字符集语法

可以使用以下语法指定字符串常量的字符集和字符序:

[_charset_name]'string' [COLLATE collation_name]

语法说明:

  • _charset_name

    下划线字符集的名称,用于定义这个字符串的字符集,不会转换字符串的编码。

    此语法仅在B兼容模式的数据库下,且系统参数b_format_behavior_compat_options含有enable_multi_charset选项时可用。

  • COLLATE collation_name

    指定字符序的名称,用于设置这个字符串的字符序属性。

使用以下方式决定字符串的字符集和字符序:

  • 如果同时指定了字符集和字符序,则使用字符集charset_name和字符序collation_namecollation_name必须是charset_name允许的字符序。

  • 如果指定了字符集但不指定字符序,则使用字符集charset_name及其默认字符序。

  • 如果不指定字符集但指定了字符序,则使用由character_set_connection系统参数设置的字符集和collation_name指定的字符序。collation_name必须是character_set_connection系统参数设置的字符集允许的字符序。

  • 如果既不指定字符集但不指定字符序,则使用由参数character_set_connectioncollation collation_name指定的字符集和字符序。

示例:

openGauss=# SELECT _utf8mb4'abc' COLLATE utf8mb4_general_ci;

十六进制或bit字符串,指定了非binary字符集,表达式数据类型会作为text

openGauss=# SELECT _utf8mb4 X'E9AB98E696AF' COLLATE utf8mb4_general_ci;
openGauss=# SELECT _utf8mb4 B'111010011010101110011000111001101001011010101111' COLLATE utf8mb4_general_ci;

十六进制或bit字符串,不指定字符集时,只能指定binary字符序:

openGauss=# SELECT X'E9AB98E696AF' COLLATE utf8mb4_general_ci;
openGauss=# SELECT B'111010011010101110011000111001101001011010101111' COLLATE utf8mb4_general_ci;

如果指定的charset_namebinary,这个表达式的数据类型会作为bytea。对于二进制数据类型,只能指定binary字符序:

openGauss=# SELECT _binary 'abc' COLLATE binary;

字符序语法

其他字符串类型的表达式也可以指定字符序:

expression [COLLATE collation_name]

语法说明:

  • COLLATE collation_name

    指定字符序的名称,用于设置这个字符串的字符序属性。

    表达式的数据类型只能是支持字符序的数据类型。

    指定的字符序必须是表达式的字符集允许的字符序。

示例:

字符序与字符集不匹配:

openGauss=#  SELECT _gbk'abc' COLLATE utf8mb4_bin;
ERROR:  COLLATION "utf8mb4_bin" is not valid for CHARACTER SET "GBK"

当表达式需要数据类型转换时,如果转换后的数据类型不含有字符序属性,COLLATE语法将被忽略,不会校验字符集,示例如下:

openGauss=#  CREATE TABLE test_collate(fint int);
CREATE TABLE

-- 插入int类型的字段时,表达式向int转换数据类型,COLLATE语法将被忽略
openGauss=#  INSERT INTO test_collate VALUES(_gbk'123' COLLATE utf8mb4_bin);
INSERT 0 1

-- 作为LIMIT表达式时,表达式向int转换数据类型,COLLATE语法将被忽略
openGauss=#  SELECT fint FROM test_collate LIMIT _gbk'123' COLLATE utf8mb4_bin;
 fint
------
  123
(1 row)

-- 显式转换为int数据类型时,COLLATE语法将被忽略
 SELECT (_gbk'123' COLLATE utf8mb4_bin)::int;
 int4
------
  123
(1 row)
意见反馈
编组 3备份
    openGauss 2024-05-09 00:42:08
    取消