数据库复习第二章
2.1 关系数据结构及形式化定义
1.关系
关系模型的数据结构只有一个数据结构:关系
关系数据结构的形式化定义:
1.域(domain)
一组具有相同数据类型的值的集合(如 \(1...100\) 的所有正整数集合)
2.笛卡尔积(cartesian product)
在域上的一种运算
定义:
给定一组域, \(D_1,D_2,....D_n\) ,其笛卡尔积为:
\(D_1 \times D_2 \times ... \times D_n = \{ (d_1,d_2,...,d_n)| d_i \in D_i , i = 1,2...,n\}\)
其中,每一个元素 \((d_1,d_2,...,d_n)\) 叫做一个 \(n\) 元组 ,每一个值 \(d_i\) 叫做一个分量
一个域允许的不同取值个数称为基数
若 \(D_i\) 为有限集,其基数为 \(m_i\) ,则 笛卡尔积的基数 \(M\) 为:
$M = \prod_{i=0}^{n} m_i $
例:
\(D_1 = \{ a,b,c \} , D_2 = \{ 1,2 \}\)
$ D_1 \times D_2 = { (a,1),(a,2),(b,1),(b,2),(c,1),(c,2)}$
3.关系(relation)
定义:
$D_1 \times D_2 \times ... \times D_n $ 的子集叫做在域 \(D_1 , D_2 ,..., D_n\) 上的关系 表示为:
\(R(D_1,D_2,...D_n)\) $ R $是关系的名字, \(n\) 是关系的度 (degree)
若关系中的某一属性的值能唯一地标识一个元祖(可以理解为某一个实例),而其子集不能,则称该属性组为候选码。
若一个关系有多个候选码,则选定其中一个作为主码。
候选码中的属性为主属性,否则为非主属性,或者非码属性
例:
一个学生有身份证号,学号,姓名这三个属性,身份证号和学号都能唯一标识一个元祖,所以是候选码,主码在这两个中间选取。而姓名为非主属性。
2.关系模式
可以形式化的表示为:
$ R(U,D,DOM,F)$
\(R\) 为关系名, \(U\) 为组成该关系的属性名集合, \(D\) 为 \(U\) 中属性所来自的域 , \(DOM\) 为属性向域的映像集合 , \(F\) 为属性间数据的依赖关系集合。
关系是关系模式在某一时刻的状态或内容 。 关系模式是静态的、稳定的,而关系是动态的、随时间不断变化的。
3.关系数据库
关系数据库的型也成为关系数据库模式,是对关系数据库的描述。
关系数据库的值是这些关系模式在某一时刻对应的关系的集合(和上面的关系模式的描述对应),通常就称为关系数据库。
2.2关系操作
3.关系的完整性
1.实体完整性
若属性A(一个或者一组)是基本关系R的主属性,则A不能为空(不知道或者无意义)
2.参照完整性
不同表之间的属性值存在互相引用,则需要保证这些值不存在非法的情况。
定义: 设 \(F\) 为基本关系 \(R\) 的一个或一组属性,但不是 \(R\) 的码。\(K_s\) 是基本关系 \(S\) 的主码。如果 \(F\) 与\(K_s\) 相对应,则称 \(F\) 是 \(R\) 的外码,并称基本关系 \(R\) 为参照关系。
另外,外码不一定要和相应的主码同名
接上面的定义:
对于每个 \(R\) 中每个元组在 \(F\) 上的值必须为空值或者 \(S\) 中某个元组的主码的值
(可以理解为值必须是有意义的)
4.关系代数
1.集合运算
(1)并
\(R \cup S = \{ t | t \in R \or t \in S\}\) 结果仍然为 \(n\) 目关系
(2)差
\(R - S = \{ t | t \in R \and t \notin S\}\)
(3)交
\(R \cap S = \{ t | t \in R \and t \in S\}\)
\(R \cap S = R - (R-S)\)
(4)笛卡尔积
(之前叙述过,就不说了
2.关系运算
(1)选择
\(\sigma (R) = \{ t|t \in F(t)='true'\}\)
\(F\) 表示选择条件,是一个逻辑表达式
(2)投影
从\(R\) 上的投影是从\(R\) 中选择出若干属性组成新的关系
$\Pi _A(R) = { r[A]|t \in R } $
\(A\) 为 \(R\) 中的属性列,投影操作是从列的角度进行的运算
(3)连接
从两个关系的笛卡尔积中选取属性间满足一定条件的元组
\(\{ t_rt_s | t_r \in R \and t_s \in S \and t_r[A] \theta t_s[B] \}\)
\(\theta\) 是比较运算符,A和B分别是R和S上列数相等且可比的属性组。
连接运算从R和S的笛卡尔积中选取R关系在A属性组上的值与S关系在B属性组上的值满足比较关系 $\theta $的元组
运算为 = 的连接成为等值连接。自然连接是一种等值连接
(4)除
若T为关系R除以关系S的结果,那么T包含所有在R中但不在S中的属性和值
且T的元组和S的元组的所有组合都在R中
\(R \div S = \{ t_r [X] |t_r \in R \and \Pi _Y (S) \sube Y_x \}\)