一起学习华为自研数据库gaussdb(dws)

一，什么是GaussDB？这次高斯不是数学家

GaussDB是华为公司数据库产品品牌名。华为公司从开始自研数据库至今已经有近20年历史,其中经历了早期发展、GaussDB的诞生和发展、数据库产业化三个阶段。本文简明介绍华为公司自研数据库的历程,并给出一些GaussDB的里程碑时间点。GaussDB的发展历史是中国数据库发展历程的典型案例。GaussDB以云服务形式提供商业版本,并已在2020年中期推出开源数据库产品openGauss(社区网址为https://opengauss.org )。

二，搜索路径

show search_path; 查看模式搜索路径，无论如何搜索路径前两个一定是pg_temp和pg_catalog
set search_path to my_schema,public; 将my_schema,public两个模式加入搜索路径

三，模式

select current_schema; 查看数据库当前模式
set current_schema=my_schema; 设置当前数据库模式。
\dn 查看所有模式及其所有者
create schema my_schema authorization dlpuser; 创建schema并指定owner
用户只能访问属于自己schema中的数据库对象，若要访问其他人的schema中数据库对象则必须具有该schema的usage权限。

四，关键设计

GTM 只维护一个CSN++ ,快照(snapshot)只包含CSN。
DN(Data Node,数据节点)本地维护事务ID(唯一标识符),维护ID 到CSN的映射(CSN_LOG)。
DN本地垃圾回收的过程中回填CSN。
单分片读事务使用本地快照:
① 获取本地最新的CSN 和准备阶段事务号;
② 如果CSN 状态为“提交中”则进行等待;
③ 如果row.CSN< localsnapshot.csn || xid in prepared_xid list可
见,否则不可见。

五，GaussDB 200详细解释

多：超大集群：Shared-Nothing架构+独创的大规模集群通讯技术，最大支持1024节点，支持在线扩容。
快：并行计算架构：充分利用集群中所有资源，提供极致分析性能，且随着集群规模扩展性能线性增长。行列混存，极速查询分析：行列混存+向量化执行，并行Bulk Load，数据快速入库。
好：全组件HA：无单节点故障，支持跨DC容灾。租户隔离：租户资源隔离，适合运营商多部门多业务场景。
省：开放架构：X86、ARM服务器部署，降低TCO。标准SQL，平滑应用迁移: 兼容标准ANSI SQL92、SQL2003应用改造小，提供Oracle、Teradata语法迁移工具。

六，数据读写原理

解析器从客户端应用获取输入的数据；
解析器对数据进行解析后，将数据分发给各个处理单元进行处理；
各个处理单元把接受的记录存储到它自己的逻辑磁盘中；
每一个处理单元的逻辑磁盘可以是一个磁盘阵列中的多块物理磁盘。

【这次高斯不是数学家】有奖征文火热进行中：https://bbs.huaweicloud.com/blogs/345260

posted @ 2022-09-06 19:08 邱明成阅读(1453) 评论(0) 收藏举报

刷新页面返回顶部

邱明成