关系代数

本文并非原创，而是自己整理老师课件所得。

概述

关系代数是关系数据库的数学基础，在关系数据库中的查询常常通过关系的运算来表示。因此关系代数就是一种抽象的查询语言。

对于关系代数，运算的三要素是：

运算对象：关系
运算符：
- 集合运算符
  
  交、并、差、广义笛卡尔积
- 专门的关系运算符
  
  选择、投影、连接、除
- 算术比较符
  
  大于、小于、等于
- 逻辑运算符
  
  与、或、非
分为基本运算和导出运算
运算结果：关系

记号

设关系模式为 $R (A_{1}, A_{2}, \dots, A_{n})$ （R是Relationship，A是Attribute），它的一个关系设为R（关系模式和关系，型和值，这个R相当于一个实例）。

$t \in R$ 表示 $t$ 是 $R$ 的一个元组。（把关系看做一张表，这就是表的一行）

$t [A_{i}]$ 表示元组 $t$ 中相应于属性 $A_{i}$ 的一个分量。（表中这一行对应的一个单元格）

若 $A = {A_{i 1}, A_{i 2}, \dots, A_{i k}}$ ，其中 $A_{i 1}, A_{i 2}, \dots, A_{i k}$ 是 $A_{i}, A_{2}, \dots, A_{n}$ 的一部分，则A称为属性组或域组。 $t [A]$ 表示元组 $t$ 在属性组上分量的集合。

$\bar{A}$ 表示所有属性去掉属性组 $A$ 剩余的属性组。

$R$ 是n目关系， $S$ 是m目关系， $t_{r} \in R$ ， $t_{s} \in S$ ， $\overset{⌢}{t_{r} t_{s}}$ 称为元组的拼接，是一个n+m列的元组。感觉n目关系就可以理解为列数为n的表。

给定一个关系 $R (X, Z)$ ， $X$ 和 $Z$ 为属性组。当 $t [X] = x$ 时， $x$ 在 $R$ 中的象集为：

Z_{x} = {t [Z] | t \in R, t [X] = x}

表示 $R$ 中属性组 $X$ 上值为 $x$ 的所有元组在 $Z$ 属性的值的集合。

比如关系为（性别，这个班同学的名字），那么“女”在[班上所有名字]中的象集为班上所有女生的名字。

运算符

先看基本运算。

选择

格式： $σ_{s e l e c t i o n - c o n d i t i o n} (R)$

选择关系 $R$ 中所有符合条件的元组（行）。

选择条件：分为三类

记A、B是属性组，op是算术运算符，v是常数。

A op v：比如age < 20
A op B：比如birthplace=residence
前两种情况用and/or/not混合起来

投影

格式： $π_{a t t r i b u t e - l i s t} (R)$

返回所有元组中，列出的属性组中的值（选择列）。

投影会自动去除重复的元组。

同时使用选择和投影即可从表中选择行列。

笛卡尔积

格式： $R_{1} \times R_{2}$

返回 $R_{1}$ 和 $R_{2}$ 中所有通过拼接可以得到的元组组成的新关系。如果原表分别m行、n行，则新表有 $m \times n$ 行，因此这个操作的空间开销很大。

如果 $R_{1}$ 和 $R_{2}$ 有同名的属性 $A$ ，则应该写全名 $R_{1} . A$ 和 $R_{2} . A$ 。为了防止属性名重复，不允许 $R \times R$ ，但是如果经过重命名操作 $ρ$ ，重命名为 $S$ ，允许 $R \times ρ_{S} (R)$ 。

满足交换律， $R_{1} \times R_{2} = R_{2} \times R_{1}$ 。因为元组是无序的。

并

格式： $R_{1} \cup R_{2}$

选择要么属于 $R_{1}$ 要么属于 $R_{2}$ 的所有元组。但是要求 $R_{1}$ 和 $R_{2}$ 必须union compatible。

即，它们必须有相同数量的属性，对应的属性要有同样的域和名字。

并也会自动去除重复的元组。

差

格式： $R_{1} - R_{2}$

返回所有属于 $R_{1}$ 而不属于 $R_{2}$ 的所有元组。

再看导出运算，会注明是如何由基本运算导出的。

交

格式： $R_{1} \cap R_{2}$

返回同时属于 $R_{1}$ 和 $R_{2}$ 的所有元组。

$R_{1} \cap R_{2} = R_{1} - (R_{1} - R_{2}) = R_{2} - (R_{2} - R_{1})$

连接

格式： $R_{1} ⋈_{j o i n - c o n d i t i o n} R_{2}$

返回 $R_{1} \times R_{2}$ 中所有符合条件的元组。

$R_{1} ⋈_{j o i n - c o n d i t i o n} R_{2} = σ_{j o i n - c o n d i t i o n} (R_{1} \times R_{2})$

等值连接：当且仅当连接条件中使用等号。

自然连接：直接用 $⋈$ 符号，无需显式指明连接条件。需要满足

两个关系中所有同名属性都用等式条件
所有同名属性最后只留一个

很像把两张纸粘起来，相同的那一列就是用来粘贴的边缘，粘完之后边缘重叠（只留一列）。

外连接： $R_{1} ⋈_{o} R_{2}$

在自然连接中，两个关系中没有被选的（同名属性的值不相等的）元组叫做dangling tuples。

外连接保留了这些元组，并且用NULL填充空值。

左/右外连接分别为 $⋊$ 和 $⋉$ ，分别只保留来自左侧/右侧的dangling tuples。

除

格式： $R_{1} \div R_{2}$

需要满足所有在 $R_{2}$ 中的属性都在 $R_{1}$ 中。

考虑 $R_{1} (A_{1}, \dots, A_{n}, B_{1}, \dots, B_{m}) \div R_{2} (B_{1}, \dots, B_{m})$

令 $T = π_{A_{1}, \dots, A_{n}} (R_{1})$ ，也就是选择 $R_{1}$ 中 $R_{2}$ 没有的那些列。

这个除会返回 $T$ 中所有“使得 $t$ 和 $R_{2}$ 的每个元组连接所得元组都在 $R_{1}$ 中”的元组 $t$ 。

$R_{1} \div R_{2} = T - π_{A_{1}, \dots, A_{n}} (T \times R_{2} - R_{1})$

上式也就是从 $T$ 中去掉“和 $R_{2}$ 连接后不在 $R_{1}$ 中的”那些元组。

另一种定义

$t \in R_{1} \div R_{2}$ 当且仅当

$t \in π_{R_{1} - R_{2}} (R_{1})$ （也就是前面的 $T$ ）
对 $R_{2}$ 中的每一个元组 $t_{R_{2}}$ ，在 $R_{1}$ 中都有元组 $t_{R_{1}}$ 同时满足以下两式：

$t_{R_{1}} [R_{2}] = t_{R_{2}} [R_{2}]$ （总有 $R_{1}$ 中的元组，在 $R_{2}$ 属性的那部分上，和 $R_{2}$ 的元组是一样的值）

$t_{R_{1}} [R_{1} - R_{2}] = t$ （且，不在 $R_{2}$ 属性的那部分，是一个符合上一点定义的 $t$ ）

例题

找出修过的课包含“学号123456的学生修过的所有课”的所有名字和GPA。

S t u d e n t s (S n o, N a m e, G P A)

T a k e s (S n o, C o u r s e)

找到学号123456的学生修过的所有课

$S E L E C T E D_C O U R S E := π_{C o u r s e} (σ_{S n o = 123456} (T a k e s))$

先在Takes中选择学号为123456对应的行，再选Course列，得到一个单元格。
找到所有上过SELECTED COURSE的学生学号

$S N O s := T a k e s \div S E L E C T E D_C O U R S E$

从Takes中选择Course=SELECTED_COURSE的行，保留除Course以外的列，此处即Sno。
得到对应这些Sno的名字和GPA

$R E S U L T := π_{N a m e, G P A} (S t u d e n t s ⋈ S N O s)$

这里的连接其实相当于选择Students的行，这些行和SNOs中Sno一样，然后再选择列，Name和GPA。

找出参与了每一个项目的员工的名字。

E m p l o y e e s (S n o, N a m e, D e p a r t m e n t)

P r o j e c t s (P r o j, N a m e, B u d g e t)

P a r t i c i p a t i o n (S n o, P r o j)

从Projects中找到Proj列，这就是所有项目

$P R O J s := π_{P r o j} (P r o j e c t s)$
从Participation中找到对应Proj取值的行，再取不要Proj列的列，即Sno列

$S N O s := P a r t i c i p a t i o n \div P R O J s$
从Employees中找到对应Sno取值的行，再取Name列

$R E S U L T := π_{N a m e} (E m p l o y e e s ⋈ S N O s)$

碎碎念

前面都没什么难的，主要是连接和除有些麻烦，但是理解了会发现并不难！还有例题里面需要用到他们的大混合。

写完这篇好像用了三个半小时，天啊……是我理解得太慢了还是编辑这些东西本身就会费时间一点，不过无所谓了！

在此委婉地表达一下我对我正在上的数据库这门课讲授方式的不适，不太现代化，又喜欢突然讲道理上价值，我基本不太愿意听下去。以此作为自学的出口。

posted @ 2023-09-21 21:01 Alouette29 阅读(91) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 随想录Day7|454. 四数相加Ⅱ、383. 赎金信、15. 三数之和、18. 四数之和

· 随想录Day4|24. 两两交换链表中的节点、19. 删除链表的倒数第N个节点、面试题 02.07. 链表相交、142. 环形链表Ⅱ

· 数据库入门之关系代数

· 数据库原理--关系代数

· 软考笔记(7)--数据库关系代数

阅读排行：
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· 别再用vector＜bool＞了！Google高级工程师：这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理
· 上周热点回顾（3.3-3.9）

公告

昵称： Alouette29
园龄： 1年5个月
粉丝： 1
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

Alouette

关系代数

关系代数

概述

记号

运算符

选择

投影

笛卡尔积

并

差

交

连接

除

例题

碎碎念

公告

搜索

常用链接

随笔分类

随笔档案

相册

阅读排行榜