PolarDB PostgreSQL 快速入门

什么是PolarDB PostgreSQL

PolarDB PostgreSQL(下文简称为PolarDB)是一款阿里云自主研发的云原生数据库产品,100%兼容PostgreSQL,采用基于Shared-Storage的存储计算分离架构,具有极致弹性、毫秒级延迟、HTAP的能力。

  1. 极致弹性:存储与计算能力均可独立地横向扩展。
    1. 当计算能力不够时,可以单独扩展计算集群,数据无需复制。
    2. 当存储容量/IO不够时,可以单独扩展存储集群,而不中断业务。

 

  1. 毫秒级延迟:
    1. WAL日志存储在共享存储上,RW到所有RO之间仅复制WAL的元数据。
    2. 独创的LogIndex技术,实现了Lazy回放和Parallel回放,理论上最大程度地缩小了RW和RO节点间的延迟。

 

  1. HTAP能力:基于Shared-Storage的分布式并行执行框架,加速在OLTP场景下的OLAP查询。一套OLTP型的数据,可支持2套计算引擎:
    1. 单机执行引擎:处理高并发的TP型负载。
    2. 分布式执行引擎:处理大查询的AP型负载。

 

PolarDB还支持时空、GIS、图像、向量、搜索、图谱等多模创新特性,应对企业对数据处理日新月异的需求。
另外,除了上述Shared-Storage云原生的模式,PolarDB还支持以Shared-Nothing模式部署,详见distribute分支的Readme

分支说明

PolarDB后续默认分支为main分支,支持存储计算分离的形态。distribute分支是分布式形态(对应之前的master分支)。

产品架构和版本规划

PolarDB采用了基于Shared-Storage的存储计算分离架构。数据库由传统的Share-Nothing,转变成了Shared-Storage架构。由原来的N份计算+N份存储,转变成了N份计算+1份存储。虽然共享存储上数据是一份,但是数据在内存中的状态是不同的,需要通过内存状态的同步来维护数据的一致性;同时主节点在刷脏时也需要做协调,避免只读节点读取到超前的“未来页面”,也要避免只读节点读取到过时的没有在内存中被正确回放的“过去页面”。为了解决该问题,PolarDB创造性地设计了LogIndex数据结构来维护页面的回放历史,该结构能够在主节点到只读节点进行同步。
在存储计算分离后,IO单路延迟变大的同时,IO的吞吐也变大了。在处理分析型查询时,仅使用单个只读节点无法发挥出存储侧的大IO带宽优势,也无法发挥其他只读节点的CPU/Mem/IO。为了解决该问题,PolarDB研发了基于Shared-Storage的并行执行引擎,能够在SQL级别上弹性利用任意数目的CPU来加速分析查询,支持HTAP的混合负载场景。
详情请查阅产品架构版本规划

文档

 

快速入门

我们提供了三种途径来使用PolarDB数据库:阿里巴巴云服务、搭建本地存储的实例、搭建基于PFS共享存储的实例(即将上线)。

阿里巴巴云服务

阿里云云原生关系型数据库PolarDB PostgreSQL引擎:官网地址

搭建本地存储的实例

我们提供了一键部署脚本,助您快速编译PolarDB内核并搭建本地实例。本节介绍了如何通过提供的一键部署脚本,快速搭建存储为本地磁盘的PolarDB实例。
**操作系统要求:**CentOS 7.5及以上。以下步骤在CentOS 7.5上通过测试。
**说明:**请使用同一个用户进行以下步骤。请勿使用root用户搭建实例。

  1. 下载PolarDB源代码,地址:
  2. 安装相关依赖:
sudo yum install readline-devel zlib-devel perl-CPAN bison flex
sudo cpan -fi Test::More IPC::Run
  1. 根据不同的搭建场景,可选择不同的脚本执行命令:
  • 只编译数据库源码,不创建本地实例:
./polardb_build.sh --noinit
  • 编译并创建本地单节点实例,节点为主节点(端口为5432):
./polardb_build.sh
  • 编译并创建本地多节点实例,节点包括:
    • 主节点1个(端口为5432)。
    • 只读节点1个(端口为5433)。

 

./polardb_build.sh --withrep --repnum=1
  • 编译并创建本地多节点实例,节点包括:
    • 主节点1个(端口为5432)。
    • 只读节点1个(端口为5433)。
    • 备库节点1个(端口为5434)。

 

./polardb_build.sh --withrep --repnum=1 --withstandby
  • 编译并创建本地多节点实例,节点包括:
    • 主节点1个(端口为5432)
    • 只读节点2个(端口分别为5433与5434)
    • 备库节点1个(端口为5435)。

 

./polardb_build.sh --withrep --repnum=2 --withstandby
  1. 部署完成后,需要进行实例检查和测试,确保部署正确。
  • 实例检查:
$HOME/tmp_basedir_polardb_pg_1100_bld/bin/psql -p 5432 -c 'select version();'
$HOME/tmp_basedir_polardb_pg_1100_bld/bin/psql -p 5432 -c 'select * from pg_replication_slots;'
  • 一键执行全量回归测试:
./polardb_build.sh --withrep --repnum=1 --withstandby -r-check-all -e -r-contrib -r-pl -r-external -r-installcheck-all

软件许可说明

PolarDB的代码的发布基于Apache 2.0版本和PostgreSQL代码的软件许可。相关的许可说明可参见LicenseNOTICE

致谢

部分代码和设计思路参考了其他开源项目,例如:PG-XC/XL(pgxc_ctl)、TBase(部分基于时间戳的vacuum 和MVCC)、Greenplum以及Citus(pg_cron)。感谢以上开源项目的贡献。

联系我们

  • 使用钉钉扫描如下二维码,加入PolarDB技术推广组钉钉群。

企业级分布式开源数据库 PolarDB for PostgreSQL-阿里云开发者社区

posted @ 2021-09-27 14:05  开源数据库  阅读(648)  评论(0编辑  收藏  举报