openGauss
开源数据库
openGauss社区官网
开源社区
openGauss 2.1.0 闪回特性
openGauss 2.1.0 闪回特性
openGauss 2.1.0 于 2021 年 9 月 30 日发布,是 openGauss 的一个 Preview 版本,该版本生命周期仅为半年。该版本的新增功能如下:
- 存储过程兼容性增强
- SQL 引擎能力增强
- 支持 Ustore 存储引擎
- 支持段页式存储
- 基于 Paxos 分布式一致性协议的高可用
- AI4DB 和 DB4AI 竞争力持续构筑
- 日志框架及错误码整改
- JDBC 客户端负载均衡及读写分离
- 支持 cmake 脚本编译
- 列存表支持主键唯一键约束
- 支持 jsonb 数据类型
- 支持 unique sql 自动淘汰
- UCE 故障感知
- 支持 GB18030 字符集
- 备机 catch 优化
- 客户端工具 gsql 支持 readline 命令自动补齐
- 动态数据脱敏
- 支持国密算法
- 防篡改账本数据库
- 内置角色和权限管理机制
- 透明加密
- 全密态数据库增强
- 支持 dblink
- 支持 Ubuntu 系统
- 支持 Hash 索引
- upsert 支持子查询
- min/max 函数支持 ip 地址类型
- 增加 array_remove/array_replace/first/last 函数
- Data Studio 客户端工具适配内核特性
虽然以上官方文档中描述的新增特性中并没有提及闪回特性,但在《管理员指南》中已经明确提及该特性的使用方法。
闪回恢复其实是利用回收站的闪回恢复删除的表。利用 MVCC 机制闪回恢复到指定时间点或者 CSN 点(commit sequence number)。
闪回技术能够有选择性的高效撤销一个已提交事务的影响,从人为错误中恢复。在采用闪回技术之前,只能通过备份恢复、PITR 等手段找回已提交的数据库修改,恢复时长需要数分钟甚至数小时。采用闪回技术后,恢复已提交的数据库修改前的数据,只需要秒级,而且恢复时间和数据库大小无关。
闪回恢复适用于:
- 误删除表的场景;
- 需要将表中的数据恢复到指定时间点或者 CSN。
闪回支持两种恢复模式:
- 基于 MVCC 多版本的数据恢复:适用于误删除、误更新、误插入数据的查询和恢复,用户通过配置旧版本保留时间,并执行相应的查询或恢复命令,查询或恢复到指定的时间点或 CSN 点。
- 基于类似 windows 系统回收站的恢复:适用于误 DROP、误 TRUNCATE 的表的恢复。用户通过配置回收站开关,并执行相应的恢复命令,可以将误 DROP、误 TRUNCATE 的表找回。
重要提示:
遗憾的是,官方文档关于闪回恢复的前提条件并没有描述到位,导致初次接触该功能的小伙伴有些茫然(我也是),无法复现闪回恢复的特性操作。这里,需要向大家明确的是:关于 openGauss 的闪回,仅支持 Ustore 存储引擎(和 Oracle 一样,闪回的数据存储在 UNDO 表空间),也就是说,我们需要创建 Ustore 存储引擎的表才可以使用 openGauss 的闪回功能。
下面我们来看看 openGauss 的闪回测试。
一、创建测试数据
- 设置 Ustore 闪回相关参数
gs_guc set -N all -I all -c "undo_zone_count=16384" ## 内存中可分配的undo zone数量,0代表禁用undo和Ustore表,建议取值为max_connections*4 gs_guc set -N all -I all -c "enable_default_ustore_table=on" ## 开启默认支持Ustore存储引擎 gs_guc set -N all -I all -c "version_retention_age=10000" ## 旧版本保留的事务数,超过该事务数的旧版本将被回收清理 gs_guc set -N all -I all -c "enable_recyclebin=on" ## 打开回收站 gs_guc set -N all -I all -c "recyclebin_retention_time=15min" ## 置回收站对象保留时间,超过该时间的回收站对象将被自动清理 gs_om -t restart
- 创建测试表
gsql -d postgres -p 26000 -r openGauss=# create table t1(a int,b int,c int,d int); openGauss=# insert into t1 values(1,2,3,4),(21,22,23,24),(31,32,33,34); openGauss=# select * from t1; a | b | c | d ----+----+----+---- 1 | 2 | 3 | 4 21 | 22 | 23 | 24 31 | 32 | 33 | 34 openGauss=# \d+ t1 Table "public.t1" Column | Type | Modifiers | Storage | Stats target | Description --------+---------+-----------+---------+--------------+------------- a | integer | | plain | | b | integer | | plain | | c | integer | | plain | | d | integer | | plain | | Has OIDs: no Options: orientation=row, compression=no, storage_type=USTORE
二、闪回查询
闪回查询可以查询过去某个时间点表的某个 snapshot 数据,这一特性可用于查看和逻辑重建意外删除或更改的受损数据。闪回查询基于 MVCC 多版本机制,通过检索查询旧版本,获取指定老版本数据。
示例:
- 更新元组
openGauss=# select current_timestamp;
pg_systimestamp
------------------------------
2021-10-12 10:03:08.272344+08
openGauss=# update t1 set a=99;
openGauss=# select * from t1;
a | b | c | d
----+----+----+----
99 | 2 | 3 | 4
99 | 22 | 23 | 24
99 | 32 | 33 | 34
- 查询 timestamp 对应的 CSN
openGauss=# select snptime,snpcsn from gs_txn_snapshot
where snptime between '2021-10-12 10:03:05.272344+08' and '2021-10-12 10:03:18.272344+08';
snptime | snpcsn
-------------------------------+--------
2021-10-12 10:03:07.583368+08 | 2213
2021-10-12 10:03:10.595467+08 | 2214
2021-10-12 10:03:13.606675+08 | 2215
2021-10-12 10:03:16.619061+08 | 2216
- 执行闪回查询命令,查看闪回结果
基于 timestamp 的闪回查询
select * from t1 timecapsule timestamp to_timestamp('2021-10-12 10:03:08.272344','YYYY-MM-DD HH24:MI:SS.FF'); a | b | c | d ----+----+----+---- 1 | 2 | 3 | 4 21 | 22 | 23 | 24 31 | 32 | 33 | 34
基于 CSN 的闪回查询
select * from t1 timecapsule csn 2213; a | b | c | d ----+----+----+---- 1 | 2 | 3 | 4 21 | 22 | 23 | 24 31 | 32 | 33 | 34
说明:
- TIMESTAMP 参数:指要查询某个表在 TIMESTAMP 这个时间点上的数据,TIMESTAMP 指一个具体的历史时间。
- CSN 参数:CSN 是一个逻辑提交时间点,数据库中的 CSN 是一个写一致性点,查询某个 CSN 下的数据代表 SQL 查询数据库在该一致性点的相关数据。
三、回收站
在拥有回收站之前,当用户误将表 drop 或 truncate 后,只能使用全库备份恢复的方式来解决这种逻辑错误。
在 openGauss 2.1.0 版本中,引入了回收站功能,用户通过该功能可以从回收站中闪回 TRUNCATE 或 DROP 的表对象,将数据恢复到错误操作前,大大提高了用户数据的可靠性。
- 闪回 drop: 可以恢复意外删除的表,从回收站(recyclebin)中恢复被删除的表及其附属结构如索引、表约束等。闪回 drop 是基于回收站机制,通过还原回收站中记录的表的物理文件,实现已 drop 表的恢复。
- 闪回 truncate: 可以恢复误操作或意外被进行 truncate 的表,从回收站中恢复被 truncate 的表及索引的物理数据。闪回 truncate 基于回收站机制,通过还原回收站中记录的表的物理文件,实现已 truncate 表的恢复。
官方文档没有强调到的坑需要注意:recyclebin 不支持 Ustore,只支持 Astore[详见下面测试示例] – 需要找开发确认,更新官方文档
示例:
- 误操作删除表
-- 创建测试数据
openGauss=# create table t1(id int,name varchar(200)) with (STORAGE_TYPE=USTORE);
openGauss=# insert into t1 values(1,'t1_Tom'),(2,'t1_Jerry');
openGauss=# select * from t1;
id | name
----+----------
1 | t1_Tom
2 | t1_Jerry
openGauss=# create table t2(id int,name varchar(200)) with (STORAGE_TYPE=ASTORE);
openGauss=# insert into t2 values(1,'t2_Tom'),(2,'t2_Jerry');
openGauss=# select * from t2;
id | name
----+----------
1 | t2_Tom
2 | t2_Jerry
-- 模拟误删表
openGauss=# drop table t1;
openGauss=# drop table t2;
- 查询回收站对象
openGauss=# SELECT rcyname,rcyoriginname,rcytablespace FROM GS_RECYCLEBIN;
rcyname | rcyoriginname | rcytablespace
-----------------------------+---------------+---------------
BIN$3BFF4EB403B$4C71318==$0 | t2 | 0 -- 仅看见Astore存储的t2表,并没有看到Ustore存储的t1表,注意!!
(1 row)
- 闪回操作
openGauss=# timecapsule table t2 to before drop rename to t2_bak;
TimeCapsule Table
openGauss=# select * from t2_bak;
id | name
----+----------
1 | t2_Tom
2 | t2_Jerry
和 Oracle 一样,也可以使用 recyname 恢复表,如“timecapsule table “BIN$3BFF4EB403B$4C71318==$0” to before drop rename to t2;”。
其他闪回操作详见官方文档。
4. 清空回收站
openGauss=# purge recyclebin;
PURGE RECYCLEBIN
以上是本人对 openGauss 2.1.0 版本闪回特性的基本测试,希望能帮助到有需要的小伙伴。