openGauss源码解析(214)

openGauss源码解析:附录 术语表

Numerics

 

2PL

两阶段锁(Two-Phase Locking),在数据库和事务处理中,二阶段锁定是一种保证序列化的并发控制方法。它也是结果集的数据库事务调度(历史)的名称。该协议利用一个事务对数据应用的锁,这些锁可以阻塞(解释为停止)其他事务在事务期间访问相同数据的信号

   

A

 

ACID

在数据库管理系统(DBMS)中,事务(Transaction)所应该具有的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、和持久性(Durability),简称ACID

ACL

访问控制列表(Access Control List),被授权访问某一资源的实体及其访问权限的列表

ADIO

异步-同步读写操作(Asynchronous-Direct Input-Output)

AI

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学

AI4DB

是指用人工智能技术优化数据库的性能,从而获得更好的执行表现;或通过人工智能的手段实现自治、免运维等。主要包括自调优、自诊断、自安全、自运维、自愈等子领域

API

应用程序编程接口(Application Programming Interface),是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节

ARM

高级精简指令集计算机器(Advanced RISC(Reduced Instruction Set Computing)Machines),具有高性能、低成本、低能耗的特点

AST

抽象语法树(Abstract Syntax Tree),用树状的形式表示源代码的语法结构

astore

追加写优化格式(Append-store)

AZ

Available Zone,通常指一个机房。

安全防护

安全防护(Security Safeguards Principle),即:个人资料应受到合理的安全保护措施之保障,以防止丢失或未经授权的访问、破坏、使用、修改或披露数据等风险

   

B

 

Benchmark

一种用于测量硬件或软件性能的测试程序

Bgwriter

数据库启动时创建的一个后台写线程,此线程用于将数据库中脏页面写入到持久性设备(例如磁盘)中

bit

比特。计算机处理的最小的信息单位。比特用来表示二进制数字1或0,或者一种逻辑条件真或假。在物理上,比特表示一个电路上高或低的电压点或者磁盘上的磁化单程或其它。一个单独的比特位所传达的信息很少有意义的。然而,一个8位组却构成了一个字节,可用于表示如一个英文字母,十进制数字,或其它字符等多种类型的信息

Bloom Filter

布隆过滤器。由Howard Bloom在1970年提出的二进制向量数据结构,它具有很好的空间和时间效率,被用来检测一个元素是不是集合中的一个成员,这种检测只会对在集合内的数据错判,而不会对不是集合内的数据进行错判,这样每个检测请求返回有“在集合内(可能错误)”和“不在集合内(绝对不在集合内)”两种情况,可见Bloom Filter是牺牲了正确率换取时间和空间

B树

B树是一种树数据结构,是一个多叉树,每个节点通常有多个子节点,一棵B树包含根节点、内部节点和叶子节点。B树通常用于数据库和操作系统的文件系统中。B树的特点是能够保持数据稳定有序,其插入与修改拥有较稳定的对数时间复杂度

备份

备份件或者备份过程。指复制并归档计算机数据,当发生数据丢失事件时,可以用该复制并归档的数据来恢复原始数据

备机

openGauss双机方案中的一个节点,用于作为主机的备份,在主机异常时,备机会切换到主机状态,以确保能正常提供数据服务

贝叶斯优化算法

贝叶斯优化算法(Bayesian Optimization),贝叶斯优化是专门优化不知道表达式的函数的,也就是说这个函数写不出y=ax+b的样子

崩溃

崩溃(或系统崩溃)指计算机或程序(例如软件应用程序或操作系统)异常终止的事件。出现错误后,通常会自动退出。有时出现恶意程序冻结或挂起直到崩溃上报服务记录崩溃的详细信息。对于操作系统内核关键部分的程序,整个计算机可能瘫痪(可能造成致命的系统错误)

编码

编码是指用代码来表示各组数据资料,使其成为可利用计算机进行处理和分析的信息。用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号

标量运算/标量计算

普通的计算机所做的计算,例如加减乘除,只能对一组数据进行操作,被称为标量运算/标量计算

表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。例如,一个表可能有3个字段:姓名、城市和国家。这个表就会有3列:一列代表姓名,一列代表城市,一列代表国家。表中的每一行包含3个字段的内容,姓名字段包含姓名,城市字段包含城市,国家字段包含国家

表空间

包含表、索引、大对象、长数据等数据的逻辑存储结构。表空间在物理数据和逻辑数据间提供了抽象的一层,为所有的数据库对象分配存储空间。表空间创建好后,创建数据库对象时可以指定该对象所属的表空间

并发控制

在多用户环境下同时执行多个事务并保证数据完整性的一个DBMS服务。并发控制是openGauss提供的一种多线程管理机制,用来保证多线程环境下在数据库中执行的操作是安全的和一致的

   

C

 

CA

证书颁发中心(Certificate Authority),签发证书、认证证书、管理已颁发证书的网络机构

CALC

使用逻辑一致性异步检查点(Checkpointing Asynchronously using Logical Consistency)

CAS

比较并交换(Compare And Swap),是原子操作的一种,可用于在多线程编程中实现不被打断的数据交换操作,从而避免多线程同时改写某一数据时由于执行顺序不确定性以及中断的不可预知性产生的数据不一致问题。该操作通过将内存中的值与指定数据进行比较,当数值一样时将内存中的数据替换为新的值

CAS

检查并设置(Check And Set)

CBO

基于代价的查询优化(Cost Based Optimization),对SQL语句对应的待选执行路径进行代价估算,从待选路径中选择代价最低的执行路径作为最终的执行计划

CBM

修改页面位图(Changed Block Map)

CEK

列加密密钥(Column Encryption Key)

CLA

贡献许可协议(Contribution License Agreement)

CLOG

事务提交信息日志(Commit Log)

CM

数据库管理模块(Cluster Manager)。管理和监控系统中各个功能单元和物理资源的运行情况,确保整个系统的稳定运行

CMK

客户端加密主密钥(Client Master Key)

core文件

当程序出现内存越界、断言失败或者访问非法内存时,操作系统会中止进程,并将当前内存状态导出到core文件中,以便进一步分析。

core文件包含内存转储,支持全二进制和指定端口格式。core文件名称由字符串core以及操作系统进程ID组成。

core文件不依赖于任何平台

Core Dump

核心转储。通常在程序异常终止时,核心转储、内存转储或系统转储用于记录特定时间计算机程序工作内存的状态。实际上,其它关键程序的状态经常在同一时间进行转储,例如处理器寄存器,包括程序指标和栈指针、内存管理信息、其它处理器和操作系统标记及信息。核心转储经常用于辅助诊断和纠错计算机程序问题

CRC

循环冗余码校验(Cyclic Redundancy Check),一种检测数据传输中的错误的过程。CRC检验根据传输的数据通过复杂的计算产生一个数。发送设备在发送数据前进行这个计算,然后将结果发送给接收设备。接收设备在接收后,重复同样的运算,如果两个设备的运算结果相同,就认为传输无误,这个过程被称为冗余检验是因为每次传输不仅包含数据而且包含额外(冗余)的差错检验值

CSN

待提交事务的序列号(Commit Sequence Number),一个64位递增无符号数

CSNLOG

事务提交日志

cstore

列存储格式(Column Store)

CU

列存储单元(Compression Unit)。在列式存储中,一列中的一批向量数据经压缩后形成CU,是列式存储的最小单位

操作系统

操作系统OS(Operating System)由引导程序加载到计算中,对计算机中其它程序进行管理。其它程序叫做应用或应用程序

查询

向数据库发出的信息请求,包含更新、修改、查询或删除信息的请求

持久性

持久性(Durability)是数据库事务的ACID特性之一。在事务完成以后,该事务对数据库所作的更改便持久的保存在数据库之中,并不会被回滚

触发器

触发器是对应用动作的响应机制,当应用对一个对象发起DML操作时,就会产生一个触发事件(Event),如果该对象上拥有该事件对应的触发器,那么就会检查触发器的触发条件(Condition)是否满足,如果满足触发条件,那么就会执行触发动作(Action)

存储过程

存储过程是在大型数据库系统中,一组为了完成特定功能的SQL语句集,用户通过指定存储过程的名字并给出参数(如果该存储过程带有参数)来执行它

   

D

 

DB4AI

是指打通数据库到人工智能应用的端到端流程,统一人工智能技术栈,达到AI应用的开箱即用、高性能、低成本等目的。例如通过SQL-like语句使用推荐系统、图像检索、时序预测等功能,充分发挥高斯数据库高并行、列存储等优势,提高机器学习任务的执行效率。同时,在数据侧实现AI计算,还可以降低数据的网络传输成本,实现本地化计算,并且可以节省人力,降低各方面的维护成本

DBA

数据库管理员(DataBase Administrator)。指导或执行所有和维护数据库环境相关的操作

DBMS

数据库管理系统(DataBase Management System)。数据库管理系统是为了访问数据库中的信息而使用的一个管理系统软件。它包含一组程序使用户可以进入、管理、查询数据库中数据。基于真实数据的位置,可以分为内存数据库管理系统和磁盘数据库管理系统

DCL

数据库控制语言(Data Control Language),控制用户对数据的访问权限,主要包括GRANT,REVOKE等操作

DDL

数据定义语言(Data Definition Language),定义、修改、删除数据模式,通常包括CREATE TABLE,ALTER TABLE,DROP TABLE等

DDPG

深度确定性策略梯度算法(Deep Deterministic Policy Gradient)

DML

数据操纵语言(Data Manipulation Language),插入、删除、更新数据,主要包括INSERT,DELETE,UPDATE等命令

DQL

元组查询(Data Query Language)

大对象

大对象(Blob)在数据库中指使用二进制方式存储的数据。它通常可以用于存储视频、音频和图像等多媒体数据

大数据

大数据(Big Data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作

等价类

在数据库的查询优化器中,等价类(Equivalent-class)是指等价的属性、实体等对象的集合,例如WHERE t1.a=t2.a中,t1.a和t2.a互相等价,组成一个等价类{t1.a,t2.a}

   

E

 

二分法

指将一个整体(或一个集合)划分为两个部分(子集)的方法,划分后的两部分相互排斥,任何内容不能同时属于这两个部分。这样的分区也经常被称为二分区

   

F

 

Failover

指当某个节点出现故障时,自动切换到备节点上的过程。反之,从备节点上切换回来的过程称为failback

FDW

外部数据封装器(Foreign Data Wrapper)

FPW

全页写(Full Page Write)

Freeze

在事务ID耗尽时由Autovacuum Worker进程自动执行的操作。openGauss会把事务ID记在行头,在一个事务取得一行时,通过比较行头的事务ID和事务本身的ID判断这行是否可见,而事务ID是一个无符号整数,如果事务ID耗尽,事务ID会跨过整数的界限重新计算,此时原先可见的行就会变成不可见的行,为了避免这个问题,Freeze操作会将行头的事务标记为一个特殊的事务ID,标记了这个特殊的事务ID的行将对所有事务可见,以此避免事务ID耗尽产生的问题

FSM

空闲空间位图文件中(Free Space Map)

分布式数据库

分布式数据库系统通常使用较小的计算机系统,每台计算机可单独放在一个地方,每台计算机中都可能有DBMS的一份完整拷贝副本,或者部分拷贝副本,并具有自己局部的数据库,位于不同地点的许多计算机通过网络互相连接,共同组成一个完整的、全局的逻辑上集中、物理上分布的大型数据库

服务器

为客户端提供服务的软硬件的组合。单独使用时,指运行服务器操作系统的计算机,也可以指提供服务的软件或者专用硬件

   

G

 

GBDT

梯度下降树(Gradient Boosting Decision Tree),一种机器学习算法

GCC

GNU编译器集(GNU Compiler Collection)

GA

遗传算法(genetic algorithm)

GIN索引

通用倒排索引(Generalized Inverted Index)。作用为处理索引项为组合值的情况,查询时需要通过索引搜索出出现在组合值中的特定元素值

GiST

通用搜索树(Generalized Search Tree)

GNU

GNU计划,又称革奴计划,是由Richard Stallman在1983年9月27日公开发起的。它的目标是创建一套完全自由的操作系统。GNU是“GNU's NotUnix”的递归缩写。Stallman宣布GNU应当发音为Guh-NOO以避免与new这个单词混淆(注:GNU在英文中原意为非洲牛羚,发音与new相同)。Unix是一种广泛使用的商业操作系统的名称。技术上讲,GNU类似Unix。但是GNU却给了用户自由

GPU

显卡的处理器称为图形处理器(Graphics Processing Unit),它是显卡的“心脏”,与CPU类似,只不过GPU是专为执行复杂的数学和几何计算而设计的,这些计算是图形渲染所必需的

gsql

openGauss交互终端。通过gsql能够以交互的方式输入查询,下发查询到openGauss,然后查看查询结果。或者,也可以从文件中输入。此外,gsql还提供许多元命令和各种类似shell命令,协助脚本编写及自动化各种任务

GTM

全局事务管理器(Global Transaction Manager)。负责全局事务号的分发,事务提交时间戳的分发以及全局事务运行状态的登记

GUC

数据库运行参数(Grand Unified Configuration)。配置这些参数可以影响数据库系统的行为

隔离性

隔离性(Isolation)是数据库事务的ACID特性之一。它是指一个事务内部的操作及使用的数据对其它并发事务是隔离的,并发执行的各个事务之间不能互相干扰

共享锁

(读取)操作创建的锁。其他用户可以并发读取数据,但任何事务都不能获取数据上的排他锁,直到已释放所有共享锁。共享锁(S锁)又称为读锁,若事务T对数据对象A加上S锁,则事务T只能读A;其他事务只能再对A加S锁,而不能加排他锁(X锁),直到T释放A上的S锁。这就保证了其他事务可以读A,但在T释放A上的S锁之前不能对A做任何修改

关系

一个关系对应通常说的一张表

关系代数

关系代数是一种抽象的查询语言,用对关系的运算来表达查询,作为研究关系数据语言的数学工具。关系代数的运算对象是关系,运算结果亦为关系

关系型数据库

关系型数据库(Relational DataBase)是创建在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。现实世界中的各种实体以及实体之间的各种联系均用关系模型来表示。标准数据查询语言SQL就是一种基于关系数据库的语言,这种语言执行对关系数据库中数据的检索和操作

关系数据模型

关系数据模型(Relational Data Model)是用二维表格表示实体和实体之间关系的数据模型

归档线程

数据库打开归档功能时启动的一个线程,此线程用于将数据库日志归档到指定的路径

   

H

 

HA

高可用性(High Availability),通过尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性

HBA

主机认证(Host-Based Authentication)。主机鉴权允许主机鉴权部分或全部系统用户。适用于系统所有用户或者使用match指令的子集。该类型鉴权对于管理计算以及其它完全同质设备非常有用。总之,服务器上的三个文件以及客户端上的一个文件必须修改,为主机鉴权做准备

HMAC

散列消息鉴别码(Hash Message Authentication Code),是一种执行“检验和”的算法,它通过对数据进行“求和”来检查数据是否被更改。在发送数据以前,HMAC加密算法对数据块和双方约定的公钥进行“散列操作”,以生成“摘要”,附加在待发送的数据块中。当数据和摘要到达其目的地时,就使用HMAC加密算法来生成另一个校验和。如果两个数字相匹配,那么数据未被做任何篡改

HOT

堆内元组(Heap Only Tuple)

HTAP

混合交易和分析处理(Hybrid Transactions and Analytics Processing)

哈希表

哈希表(Hash Table,也叫散列表),是根据关键码值(Key Value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表

哈希桶

Hash Bucket

函数

函数是一块可执行代码,它被赋予一个名字并可以在其他位置调用。一个函数也可以被定义为带有参数,它指定一列由调用者传递的参数值

行存储

数据按行进行存储,区别于列式存储(简称列存)。传统的事务处理型(OLTP)数据库所采用的存储方式

   

I

 

ICDE

数据工程国际会议(International Conference on Data Engineering),是数据和数据库领域的顶级会议

IO

I/O输入/输出(Input/Output)

   

J

 

JDBC

Java数据库连接(Java Database Connectivity),是一种用于执行SQL语句的Java API,应用程序可基于它操作数据库

基本表

在SQL中,把传统的关系模型中的关系模式称为基本表(Base Table),基本表是本身独立的表,一个关系就对应一个基本表

记录

在关系型数据库中,每一条记录对应表中的每一行数据

机器学习

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能

基于角色的访问控制

角色的访问控制机制(Role-Based Access Control,RBAC),一种访问控制模型和策略。权限与角色相关联,用户通过成为适当角色的成员而得到这些角色的权限,角色是为了完成各种任务而创建,用户则依据它的责任和资格来被指派相应的角色

加密

用于传输数据的功能。通过该功能,可以隐藏信息内容,防止非法使用。

检查点

将数据库内存中某一时刻的数据存到磁盘的机制。openGauss定期将已提交的事务数据和未提交的事务数据存到磁盘,这些数据用来和Redo日志一起在数据库重启和崩溃时恢复数据库

节点

将构成openGauss数据库环境的各台服务器(物理机或虚拟机)称为数据库节点,简称节点

进程

在单个计算机上执行程序的实例。一个进程由一个或多个线程组成。其它进程不能接入某个进程已占用的线程

矩阵

矩阵(Matrix)是一个按照长方阵列排列的复数或实数集合

角色

角色是权限的集合,角色可以自定义,角色可以赋予给多个用户

角色是权限分配的单位与载体。角色通过继承关系支持分级的权限实现。我们通过对角色分配访问权限控制,然后对用户或者用户组分派角色来实现用户的访问权限控制

   

K

 

客户端

连接或请求其它计算机或程序服务的计算机或程序

可用性

IT服务和其组成部分(基础设施、基础平台、应用等)在规定的时间点或者规定的时间段内提供所需功能的能力

可用页面队列

Available Page Queue

空闲空间管理

管理表内空闲空间的机制,通过记录每个表内空闲空间信息,并建立易于查找的数据结构,可以加速对空闲空间进行的操作(例如INSERT)

快照隔离

事务隔离级别(Snapshot Isolation,SI),事务执行的每一次读操作都会返回事务开始时的所有数据,因为快照事务不使用锁来保护读操作,因此不会阻止其他事务修改快照事务读取的任何数据

   

L

 

LLVM

Low Level Virtual Machine,一个编译器框架,提供了与编译器相关的支持,能够进行程序语言的编译期优化、连接优化、在线编译优化、代码生成

Lock

Lock确保当一个线程位于代码的临界区时,另一个线程不进入临界区。如果其他线程试图进入锁定的代码,则它将一直等待(即被阻止),直到该对象被释放

LRU

最近最少使用(Least Recently Used)

LSN

LSN(Log Sequence Number)指日志序列号

连接

通过SQL查询语句为数据库中的表创建的一种临时关系。连接是通过字段的值将多张表结合在一起的。通过SQL语句可以执行几种不同的连接方式,包括内连接、外连接、左连接、右连接、自连接等

字段的等效概念。在数据库中,表由一列或多列组成

列存储

数据按列进行存储,是数据库数据组织和存储的一种有效方式,OLAP环境下数据读取操作性能更为优越

列式数据库

列式数据库(Column-Oriented DataBase)将数据存储为列的一部分,而不是行,这使得列数据库在单列中存储大量数据时能够最大化其性能,适合于批量数据处理和即时查询

逻辑复制

数据库主备或两个数据库间的数据同步方式。区别于通过物理日志回放方式的物理复制,逻辑复制在两个数据库间传输逻辑日志或通过逻辑日志对应的SQL语句实现数据同步

逻辑日志

数据库修改的日志记录,可直接对应为SQL语句,一般为行级记录。区别于物理日志,物理日志是记录物理页面修改的日志

逻辑节点

一个物理节点上可以安装多个逻辑节点。一个逻辑节点是一个数据库实例

逻辑复制槽

在逻辑复制的环境下,逻辑复制槽用以防止XLOG被系统或Vaccum回收。openGauss中用于记录逻辑解码位置的对象,提供创建、删除、读取、推进等多个SQL接口函数

   

M

 

MAC

消息认证码(Message Authentication Code),在加密过程中计算出来并被附加到消息上的值。接收系统收到消息后执行相同的计算,把它的计算结果同附加在消息上的结果进行比较。如果值相同,则接收方就可以确定消息在传送过程中没有被篡改过

Mass tree

一种用于多核的快速非事务性B树

MCV

描述某列中出现次数最多的值

MOT存储引擎

内存优化表(Memory-Optimized Table)存储引擎是一种事务性行存储引擎,针对多核和大内存服务器进行了优化

mstore

内存优化格式(Memory-Store)

MTU

最大传输单元(Maximum Transmission Unit),在网络中能够传输的最大数据报文

MVCC

多版本并发控制(Multi-Version Concurrency Control),数据库并发控制协议的一种,它的基本算法是一个元组可以有多个版本,不同的查询可以工作在不同的版本上

模式

数据库内所包含的逻辑结构,包括基本表的定义等等

   

N

 

NUMA

非一致性内存访问(Non-Uniform Memory Access)一种分布式存储器访问方式,处理器可以同时访问不同的存储器地址,大幅度提高并行性。NUMA模式下,处理器被划分成多个“节点”(Node),每个节点被分配有的本地存储器空间。所有节点中的处理器都可以访问全部的系统物理存储器,但是访问本节点内的存储器所需要的时间,比访问某些远程节点内的存储器所花的时间要少得多

   

O

 

OCC

乐观并发控制(Optimistic Concurrency Control),又名“乐观锁”,是一种并发控制的方法。它假设多用户并发的事务在处理时不会彼此互相影响,各事务能够在不产生锁的情况下处理各自影响的那部分数据。在提交数据更新之前,每个事务会先检查在该事务读取数据后,有没有其他事务又修改了该数据。如果其他事务有更新的话,正在提交的事务会进行回滚

ODBC

开放式数据库连接(Open DataBase Connectivity),一种数据访问应用程序接口(API),支持对可使用ODBC驱动程序的任何数据源的访问。ODBC与美国国家标准学会(ANSI)和国际标准化组织(ISO)制定的关于数据库调用级接口(CLI)的标准一致

OID

对象标识符(Object Identifier),在计算领域,用于标识对象的标识符

OLAP

联机分析处理(OnLine Analytical Processing),是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便准确掌握企业(公司)的经营状况,了解对象的需求,制定正确的方案

OLTP

联机事务处理(OnLine Transaction Processing),也称为面向交易的处理过程,其基本特征是前台接收的用户数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果,是对用户操作快速响应的方式之一

OM

运维管理模块(Operations Management)。提供数据库日常运维、配置管理的管理接口、工具

   

P

 

Page

openGauss数据库关系对象结构中行存的最小内存单元。一个Page大小为默认为8kB

PCC

悲观并发控制(Pessimistic Concurrency Control)(又名“悲观锁”,是一种并发控制的方法。它可以阻止一个事务以影响其他用户的方式来修改数据。如果一个事务执行的操作读某行数据应用了锁,那只有当这个事务把锁释放,其他事务才能够执行与该锁冲突的操作

PCR

页面一致性读取(Page Consistency Read)

PITR

时间点恢复(Point-In-Time Recovery)。基于时间点恢复是openGauss备份恢复的一个特性,是指在备份数据和WAL日志正常的情况下,数据可以恢复到指定时间点

Postmaster

数据库服务启动时启动的一个线程。用于侦听来自数据库其它节点或客户端的连接请求。

主机上侦听到备机连接请求,并接受后,就会创建一个wal sender线程,用于处理与备机的交互

PSO

粒子群优化算法(Particle Swarm Optimization),是一种基于群体写作的随机搜索算法。每个优化问题的解我们称之为“粒子”,所有的粒子都有一个由被优化的函数决定的适应值,每个粒子的运动受到其局部最已知位置的影响,但也会被引导到搜索空间中最已知的位置,这些位置随着其他粒子找到更好的位置而更新

psort

列存储局部排序索引

排他锁

排他锁(Exclusive Locks,简称X锁),又称为写锁、独占锁,是一种基本的锁类型。若事务T对数据对象A加上X锁,则只允许T读取和修改A,其他任何事务都不能再对A加任何类型的锁,直到T释放A上的锁。这就保证了其他事务在T释放A上的锁之前不能再读取和修改A

   

Q

 

潜在空闲空间

Potential Free Space

潜在空页队列

Potential Empty Page Queue

强化学习

强化学习(又称再励学习,评价学习)是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。但在传统的机器学习分类中没有提到过强化学习,而在连接主义学习中,把学习算法分为三种类型,即非监督学习、监督学习和强化学习

全备份

备份整个数据库

全量同步

openGauss双机方案中的一种数据同步机制,是指把主机中的所有数据同步给备机

   

R

 

RCR

行一致性读取(Row Consistency Read)

REDO日志

记录对数据库进行操作的日志,这些日志包含重新执行这些操作所需要的信息。当数据库故障时,可以利用redo日志将数据库恢复到故障前的状态

RL

强化学习(Reinforcement Learning),又称再励学习,评价学习。是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。但在传统的机器学习分类中没有提到过强化学习,而在连接主义学习中,把学习算法分为三种类型,即非监督学习、监督学习和强化学习

RPC

远程过程调用(Remote Procedure Call)是一个计算机通信协议。该协议允许运行于一台计算机的程序调用另一台计算机的子程序,而程序员无需额外地为这个交互作用编程

RTO

目标恢复时间(Recovery Time Objective),一种业务切换策略,是容灾切换时间最短的策略。以恢复时间点为目标,确保容灾机能够快速接管业务

日志文件

计算机记录自身活动的记录

   

S

 

Savepoint

保存点。是一种在关系数据库管理系统中实现子事务(也称为嵌套事务)的方法。在一个长事务中,可以把操作过程分成几部分,前面部分执行成功后,可以建一个保存点,若后面的执行失败,则回滚到这个保存点即可,无需回滚整个事务。保存点对于在数据库应用程序中实现复杂错误恢复很有用。如果在多语句事务中发生错误,则应用程序可能能够从错误中恢复(通过回滚到保存点)而无需中止整个事务

Session

数据库系统在接收到应用程序的连接请求时,为该连接创建的一个任务。它被Session Manager管理,完成一些初始化任务,执行用户的所有操作

SIG

特别兴趣小组(Special Interest Group)

SIGMOD

ACM SIGMOD数据管理国际会议是由美国计算机协会(ACM)数据管理专业委员会(SIGMOD)发起、在数据库领域具有最高学术地位的国际性学术会议。SIGMOD的前身是SIGFIDET,SIGFIDET成立于1969年,而在1970年的9月,它转变为了SIG。4年后,于1974年,SIG决定改名为SIGMOD(Special Interest Group on Management Of Data)

SIMD

单指令流多数据流(Single-Instruction, Multiple-Data Stream Processing),一种并行处理器计算机结构,其中一个指令处理器取得指令,并将其分配给其他一些处理器进行处理。可以一条指令执行多个位宽数据的计算

SLA

服务水平协议(Service Level Agreement)是在一定开销下为保障服务的性能和可靠性,服务提供商与用户间定义的一种双方认可的协定。通常这个开销是驱动提供服务质量的主要因素

SLRU

简单最近最少使用(Simple Least Recently Used)

SPSC

单生产者单消费者(Single Producer Single Consumer)

SQL

结构化查询语言(Structure Query Language),数据库的标准查询语言。它可以分为数据定义语言(DDL)、数据操纵语言(DML)、数据查询语言(DQL)和数据控制语言(DCL)

SSD

固态硬盘(Solid State Disk)

SSL

安全套接层(Secure Sockets Layer),利用数据加密技术确保数据在网络传输过程中不会被截取及窃听

SVM

支持向量机(Support Vector Machine),用于机器学习,是建立在统计学习理论基础上的一种模式识别方法,能够根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷

视图

一个“虚拟的表”,它不实际存在数据库中,但由DBMS从现有所涉及的基本表中产生,按照一定的规则显示。可以根据需要自行定制并负责视图中的数据组织。视图像表一样由列组成,其查询方式与表相同,但视图中没有数据。视图中的列可以在一个或多个表中找到。对视图进行查询时,视图将查询其定义中的表,并且以视图定义所规定的格式和顺序返回值

事务

数据库管理系统执行过程中的一个逻辑单位,由一个有限的数据库操作序列构成,事务必须满足ACID原则

属性

关系表中的一列即为一个属性,给每一个属性起一个名称即属性名

数据

数据(Data)是事实或指令的一种表达形式,适用于人为或自动的通信、解释或处理。数据包含常量、变量、阵列和字符串

数据分区

数据分区是指在一个数据库实例内部,将表按照划分为多个数据互不重叠的部分(Partition)。具体的分区方式可以有:范围分区(Range),它根据元组中指定字段的取值所处的范围映射到目标存储位置。

数据库

数据库(DataBase,DB)是存储在一起的相关数据的集合,这些数据可以被访问、管理以及更新。同一视图中,数据库可以根据存储内容类型分为以下几类:数目类、全文本类、数字类及图像类

数据库管理员

数据库管理员(DataBase Administrator,DBA),指导或执行所有和维护数据库相关的操作的人员

数据库实例

一个数据库实例是一个openGauss进程以及它控制的数据库文件。openGauss在一个物理节点上安装多个数据库实例。一个数据库实例也被称为一个逻辑节点

数据库文件

保存用户数据和数据库系统内部数据的二进制文件

数据字典

数据字典是一系列只读的表,用来提供数据库的信息。这些信息包括:数据库设计信息、存储过程信息、用户权限、用户统计数据、数据库进程信息、数据库增长统计数据和数据库性能统计数据

数据类型

在编程语言中,指允许表示诸如字符、整数或浮点数等的机制。类型决定了分配到变量的存储以及能在变量上执行的操作

数据挖掘

数据挖掘一般是指从大量的数据中自动搜索隐藏于其中的,有着特殊关系性的信息的过程。它通常与计算机科学有关,通过统计、在线分析处理、情报检索、机器学习和模式识别等诸多方法来实现上述目标

数据主体

数据主体(Data Subject),计算机系统储存数据有关的个人主体

死锁

为使用同一资源而产生的无法解决的争用状态

索引

在关系数据库中,索引是一种与表有关的数据库结构,它可以使对应于表的SQL语句执行得更快。索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容

索引扫描

Index Scan

仅索引扫描

Index Only Scan

   

T

 

TD

事务目录(Transaction Directory)

TGT

根凭证(Ticket Granting Ticket),一种用户第一次登录某Web应用系统时SSO服务器端生成的凭证。该凭证在用户退出系统之前都不会变化,持有该凭证的用户可直接访问SSO服务器管理下的其他Web应用系统,无需重新输入登录信息

TGT

票据分发服务(Ticket-Granting Ticket)

TID

元组标识符(Tuple Identifier)。关系数据库中元组的惟一标识,亦是元组的逻辑地址。用它来检索,存取效率较高

TID

事务ID(Transaction ID)

TCP

传输控制协议(Transmission Control Protocol)。用于将数据信息分解成信息包,使之经过IP协议发送;并对利用IP协议接收来的信息包进行校验并将其重新装配成完整的信息。TCP是面向连接的可靠协议,能够确保信息的无误发送

TOAST

过长字段存储技术(The Oversized-Attribute Storage Technique)

TPC-C

TPC-C是事务处理性能委员会TPC(Transaction Processing Performance Council)提供的专门针对联机交易处理系统(OLTP系统)的规范

TPC-DS

TPC-DS是事务处理性能委员会TPC提供的一个支撑决策的基准,其为决策支撑系统几个通用方面建模,包括查询和数据维护。作为通用决策支持系统,该基准对性能的评估具有代表性

TPC-H

TPC-H是事务处理性能委员会TPC提供的专门针对联机分析处理系统(OLAP系统)的性能评价指标

trace

一种特殊的日志记录方法,用来记录程序执行的信息。程序员使用该信息进行纠错。另外,根据trace日志中信息的类型和内容,有经验的系统管理员或技术支持人员以及软件监控工具诊断软件常见问题。

统计信息

数据库使用统计信息估算查询代价,以查找代价最小的执行计划,统计信息一般是数据库自动收集的,包括表级信息(元组数、页面数等)和列级信息(列的值域分布直方图)

图数据库

图数据库(Graph Database)是一种非关系型数据库,它应用图形理论存储实体之间的关系信息。最常见例子就是社会网络中人与人之间的关系

投影

基于给定列值计算派生列集,即执行标量表达式

   

U

 

UDF

用户自定义函数(User Defined Function)

UDP

用户数据报协议(User Datagram Protocol),允许一端设备的应用程序向另一端的应用程序发送数据报的标准TCP/IP协议。UDP利用IP协议发送数据报,为应用程序提供不可靠的无连接报文发送服务。因此,UDP消息可能会出现丢弃、重复、延迟或乱序发送的问题。UDP用于尽力传输数据报文,即目的端不会主动确认是否已经接收到正确的数据报文

URL

通用资源定位器(Uniform Resource Locator),唯一标识Internet上网页和其他资源位置的地址。URL通常以http://开头,如http://www.example.com,可以包括如超文本网页(扩展名通常为.html或.htm)名称之类的详细信息

URQ

UBtree Recycle Queue

ustore

ustore属于In-place Update更新模式,中文意思为“原地更新”

   

V

 

Vacuum

数据库定期启动的清理垃圾元组的线程,根据配置参数可以同时启动多个

verbose

verbose选项指定显示在屏幕上的处理信息

VLDB

VLDB(Very Large Data Bases)是数据库研究人员、供应商、参与者、应用开发者、以及用户一年一度的主要国际论坛。VLDB国际会议于1975在美国的弗雷明汉马(Framingham MA)成立,由VLDB基金会赞助,目的是促进和交换数据库和世界各地的相关的领域中的学术工作

VM

可见性位图(Visibility Map)

   

W

 

WAL

预写式日志(Write-Ahead Logging)是一种实现事务日志的标准方法,对数据文件(它们是表和索引的载体)的修改必须先持久化相应的日志

wal receiver

数据库复制时备机创建的一个线程的名称。此线程用于从主机接收数据、命令,并反馈确认信息至主机。一个备机只有一个wal receiver线程

wal sender

数据库复制过程中,主机接受到备机的连接请求后创建的一个线程的名称。此线程用于发送命令、数据到备机,并从备机接收信息。一个主机可能会有多个wal sender线程,每一个wal sender线程对应一个备机的一个连接请求。

wal writer

数据库启动时创建的一个写Redo日志的线程,用于将内存中的日志写入到持久性设备(如:磁盘)

WDR

工作负荷诊断报告(Wordload Dignostic Report)

WEB

全球广域网(World Wide Web)

谓词

谓词(Predicate)即SQL语句中的条件,例如SELECT * FROM t1 WHERE t1.a=1;中的t1.a=1即为谓词

物理节点

一个物理机器称为一个物理节点

   

X

 

XID

XID(Transaction ID)指事务的唯一标识,即一个全局递增的事务号

XLOG

表示事务日志,一个逻辑节点中只有一个,不允许创建多个XLOG文件

系统表

存储数据库元信息的表,元信息包括数据库中的用户表、索引、列、函数和数据类型等

下推

openGauss可以利用多DN并行执行查询计划,即将数据库主节点中的查询计划下发到各DN中并行执行。这种行为称为下推。与将数据抽取到数据库主节点上执行查询的方式相比,下推可以大幅提升查询性能

显式事务

用户在所执行的一条或多条SQL语句的前后,显式添加了开启事务START TRANSACTION语句和提交事务COMMIT语句

线程

线程(Thread)是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务

向量化引擎

向量化执行引擎是基于数据库列存储模式及CPU中的SIMD(即Single Instruction,Multiple Data,一条指令操作多个数据。)机制用于提高数据执行效率的引擎

向量数组

Vector Batch

   

Y

 

压缩

数据压缩,信源编码,或比特率降低涉及使用相比原来较少比特的编码信息。压缩可以是有损或无损。无损压缩通过识别和消除统计冗余降低比特位。无损压缩中没有信息丢失。有损压缩识别并删除次要信息,减少了比特位。减少数据文件大小的方法被普遍称为数据压缩,尽管其正式名称为源编码(数据源的编码,然后将其存储或传输)

一致性

一致性(Consistency)是数据库事务的ACID特性之一。在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏

优化器

优化器(Optimizer)是数据库中内置的一个核心子系统,优化器的目的是按照一定的判断原则来得到它认为目标SQL在当前情形下最高效的执行路径(Access Path),也就是说优化器的目的是为了得到目标SQL的执行计划

游标

游标是与某一查询结果相联系的符号名,用于把集合操作转换成单记录处理方式

域是一组具有相同数据类型的值的集合。属性的取值范围来自某个域

预留可用空间

Reserved Free Space

元数据

用来定义数据的数据。主要是描述数据自身信息,包含源、大小、格式或其它数据特征。数据库字段中,元数据用于理解以及诠释数据仓库的内容

元组

关系表中的一行即为一个元组

原子性

原子性(Atomicity)数据库事务的ACID特性之一。整个事务中的所有操作,要么全部完成,要么全部不完成,不可能停滞在中间某个环节。事务在执行过程中发生错误,会被回滚到事务开始前的状态,就像这个事务从来没有执行过一样

云计算

云计算(Cloud Computing)是一种通过Internet以服务的方式提供动态可伸缩的虚拟化的资源的计算模式

   

Z

 

脏页面

已经被修改且未写入持久性设备的页面

增量备份

基于上次有效备份之后对文件修改的备份

主机

openGauss数据库双机系统中接受数据读写操作的节点,和所有备机一起协同工作。在同一时间内,双机系统中只有一个节点被标识为主机

转储文件

转储文件是一种特定类型的trace文件。转储文件为响应事件过程中一次性输出的诊断数据,trace文件指诊断数据的连续输出

posted @ 2024-05-07 09:33  openGauss-bot  阅读(17)  评论(0编辑  收藏  举报