TDSQL-PG 数据重分布

记录一次数据重分布造成的数据库抖动。

何为数据重分布:

select * from t1,t2 where t1.id1=t2.id2;

若id1,id2都为分片键,在做算子下推到dn时，由于分片键是hash算法，所以id1，id2相同的值都在同一个dn上。每个dn可以独立完成数据过滤。dn计算的数据在CN聚合后，返回客户端。
若id1,id2有一个不是分片键，在做算子下推到dn时，dn无法单独完成数据过滤，需要跟其它dn建立连接，获取缺失的数据后，再进行数据过滤。过滤完成后，将数据在cn汇聚后反馈给客户端。---这就是数据重分布
dn从其他dn节点获取数据时，是通过pooler进程进行调度。pooler是cn的连接池，用于跟dn建立连接。以此例分析：sql从cn下推到dn001，dn002。dn001通过pooler去dn002获取必要的数据进行计算，dn002也通过pooler进程去dn001获取数据进行计算。
当dn数量较多，并发较高时，pooler会非常繁忙，导致正常的sql没法正常的从CN下推到dn进行计算获取数据，造成等待。反馈到数据库层面会有连接数增加，大量慢SQL。反馈到应用层面会有应用响应时间变长，甚至无法创建新连接，引发应用宕机等。

数据重分布的危害：

可能将pooler连接池里的连接全部耗光，表现为dn连接数上升。
cn、dn之间大量的数据交互，影响网络带宽。
高并发场景下pooler响应时间变慢，影响全局sql，导致全局SQL变慢。表现形式为数据库端大量的慢sql，cn连接数增加，活动会话增加。应用响应时间变长，应用无法跟数据库建立连接等问题。

整改方案：

约束开发：高并发SQL的where条件中，只能允许通过分片键过滤。---对开发要求较高
分布式表改造成复制表：每个DN上有完整的数据，通过非分片键进行过滤时，没有数据的重分布。---若表较大，十分浪费存储

set lock_timeout=30000;

create table t_product_0818  (like t_product  including all) distribute by replication to group default_group;  ---including all不包括外键
alter table t_product rename to t_product_ori_0818 ;  
insert into t_product_0818 select * from t_product_ori_0818  ;
vacuum analyze t_product_0818   ;
alter table t_product_0818   rename to t_product ;

posted @ 2023-08-28 14:51 z_uncle 阅读(341) 评论(0) 收藏举报

刷新页面返回顶部

z-uncle

TDSQL-PG 数据重分布

何为数据重分布:

数据重分布的危害：

整改方案：

公告