openGauss 3.0 支持 kubernetes 部署分布式数据库:支持一键式部署分布式数据库,通过 patroni 实现计划内 switchover 和故障场景自动 failover, 通过 haproxy 实现 openGauss 主备节点读写负载均衡,通过 shardingsphere 实现分布式能力,所有功能打包至镜像并提供一键式部署脚本。


patroni 介绍

patroni 基本原理:

patroni 通过使用 etcd,向其插入键值对记录 patroni 参数、数据库参数、主备信息以及连接信息,平常通过 etcd 对其它节点做心跳检测,通过从 etcd 获取键值对中存储的主备信息来判断各节点的状态对集群进行自动管理。

haproxy 介绍

  • HAProxy 是一个开源的项目,其代码托管在 Github 上,代码链接如下:HAProxy 代码链接
  • HAProxy 提供高可用性、负载均衡以及基于 TCP 和 HTTP 应用的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。
  • HAProxy 实现了一种事件驱动, 单一进程模型,此模型支持非常大的并发连接数


listen master
    bind *:5000
        mode tcp
        option tcplog
        balance roundrobin
    option httpchk OPTIONS /master
    http-check expect status 200
    default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
        server node1 ***.***.***.***:5432 maxconn 1000 check port 8008 inter 5000 rise 2 fall 2
        server node2 ***.***.***.***:5432 maxconn 1000 check port 8008 inter 5000 rise 2 fall 2
listen replicas
    bind *:5001
        mode tcp
        option tcplog
        balance roundrobin
    option httpchk OPTIONS /replica
    http-check expect status 200
    default-server inter 3s fall 3 rise 2 on-marked-down shutdown-sessions
        server node1 ***.***.***.***:5432 maxconn 1000 check port 8008 inter 5000 rise 2 fall 2
        server node2 ***.***.***.***:5432 maxconn 1000 check port 8008 inter 5000 rise 2 fall 2

(1) 由Patroni自身使用用以leader竞选;
(2) 由patronictl工具使用用以执行 failovers、switchovers、reinitialize、restarts、reloads操作;
(3) 由HAProxy或者其他负载均衡器进行HTTP健康监测,或者监控。
本文中HAProxy即利用Patroni中的REST API进行健康监测,进而识别集群中的主机,备机,以及各个节点的健康状态。

对于下列的请求:当Patroni节点拥有leader锁,且作为primary节点running时,Patroni REST API将返回HTTP状态码200:
(1) GET /
(2) GET /master
(3) GET /primary
(4) GET /read-write

option httpchk相当于调用了GET /请求,
http-check expect status 200

###对于GET /replica请求,当Patroni节点为running状态,角色为replica,未设置noloadbalance标签时,http返回状态码为200。
option httpchk OPTIONS /replica即调用了OPTIONS /replica请求,并以OPTIONS代替GET简化返回的信息,
http-check expect status 200相当于过滤出健康监测返回的状态码应为200,因此当所配置的数据库为集群中的备机时,
其状态码为200,于是上面的配置即选出了数据库集群中的备机,同时配置balance roundrobin,即定义负载均衡算法,

* The following requests to Patroni REST API will return HTTP status code 200 only
when the Patroni node is running as the primary with leader lock:
    * GET /
    * GET /master
    * GET /primary
    * GET /read-write

* GET /standby-leader: returns HTTP status code 200 only when the Patroni node is running as
the leader in a standby cluster.

* GET /leader: returns HTTP status code 200 when the Patroni node has the leader lock.
The major difference from the two previous endpoints is that it doesn’t take into account whether
PostgreSQL is running as the primary or the standby_leader.

* GET /replica: replica health check endpoint. It returns HTTP status code 200 only when
the Patroni node is in the state running, the role is replica and noloadbalance tag is not set.