openGauss
开源数据库
openGauss社区官网
开源社区
openGauss亮相ICDE2021,分享数据库的AI晋级之路
作为全球数据库领域三大顶级的学术会议之一的 ICDE(另两个是 SIGMOD 和 VLDB)是 IEEE(电气电子工程师学会)旗下针对数据库技术领域设计,构建实现,未来演进等进行的一系列研讨与学术分享活动,在全球数据库工程师群体內影响非凡。
因受疫情影响, ICDE2021 以纯线上形式举行。openGauss 作为开源数据库的新兴力量首次亮相,同时 openGauss 社区技术专家、华为高斯数据库高级工程师王天庆在圆桌论坛上,做了以“openGauss 的 AI 能力不断演进之路”的专题发言,提出 AI 将是未来数据库发展的关键,AI 将使数据库发展突破当前天花板,进入新的阶段。
'通过引入 AI 技术,数据库将会变得更加智能。基于深度学习、机器学习、优化算法等人工智能方法可以在数据库上实现自我演进的优化器、智能化的索引。以及实现支持数据库故障自诊断、自愈等更加智能化的自治系统,最终将可能演进到具备全场景、自决策的、更加完备的智能化数据库管理系统,实现数据库的开发、交付、运维的端到端智能化平台。 ——华为高斯数据库高级工程师王天庆
王天庆表示,3 月 30 日 openGauss 社区正式发布了最新的 2.0 版本。新版本中除了具备 4 路鲲鹏达到 230 万的 tpmC 卓越性能外,还在全密态数据库、数据库系统安全性等方面持续增强。并进一步完善了数据库的 AI 框架(AI framework for Database),使 AI 能力完全融入到数据库的各个层面和使用场景中,这是数据库原生 AI 能力的关键一步,也是数据库智能化的基础。
openGauss 数据库 AI 框架具有以下特点:
全栈 AI 数据库:整个框架纵向来看, 向下融合通用 AI 技术栈;向上支持用户、DBA、开发者、数据分析师等全类型用户,从而支撑 SQL, DBMS 和 DB Kernel 全场景的智能。从水平方向来看,主要具备两部分能力:AI4DB 与 DB4AI. 其中 DB4AI 可实现全流程 AI,构筑数据库內参数优化、模型选择、自动化特征工程等技术,压缩数据分析技术栈,让用户在数据库中利用 SQL 语句驱动 AI 任务。
全场景 AI 数据库:AI4DB-利用 AI 技能两条线赋能。在 DBMS 中,AI 能够对数据库的分布键、视图和索引等给予推荐,使数据库调优周期从天级下降为秒级。內置在 DBMS 中常用故障模式库,可以结合 AI 和规则引擎预测软件故障,还能通过 AI 算法分析故障根因,并尝试自动化修复;在 DB Kernel 中,利用 AI 技术可实现优化器的自我更新、自学习型索引以及负载的智能编排,从而达到提升性能、减少人为操作的效果。
数据库调优是 AI 的典型应用场景,在数据库项目交付过程中,性能问题定位、调优要占据交付周期的大部分时间和资源,慢 SQL 发现技术在上线前可以对 SQL 做预评估,提早发现可能性能瓶颈点。上线后对系统负载进行透视分析。数据工程师利用內置在 DB kernel 內部的 AI 能力对单条或全局的 SQL 智能索引推荐,解决性能问题。
王天庆说,以 openGauss 2.0 版本为例,已经引入了大量的 AI 能力,如慢 SQL 发现,智能索引,智能预测等。在实际应用中,合理的索引配置会对业务性能有几倍甚至几十倍的提升。同时系统运维效率也可以大幅提升,未来 80%的日常运维工作都可由 AI 完成。
随着 AI 技术在数据库领域的使用范围日趋广泛的同时,数据库在实际使用场景也越来越复杂化、多元化,如何将 AI 技术与数据库更好的结合起来需要数据库行业的技术专家们共同努力。