摘要:
# 前提条件 Spark 使用的语言是 Scala,而 Scala 需要运行在 JVM 之上。因此,搭建 Spark 的运行环境应该是 JDK 和 Scala。由于学习 Spark 源码的参考书籍是《Spark内核设计的艺术架构设计与实现》,所以就按照作者安装的版本进行安装: * Java8 * S 阅读全文
摘要:
# 事务处理 > 事务简介 事务是一个应用层面的操作 ,通过一系列的数据库操作执行。一个事务会影响数据库的状态。 ![事务对数据库的影响](https://img2023.cnblogs.com/blog/2306858/202307/2306858-20230704141717330-112468 阅读全文
摘要:
# 查询执行 > 查询执行简介 在这一阶段中,数据库引擎接受从优化器而来的执行计划,执行该计划并得到结果元组。 ![查询执行](https://img2023.cnblogs.com/blog/2306858/202307/2306858-20230702231514555-308180634.pn 阅读全文
摘要:
# 查询评估 > 查询评估介绍 之前介绍的下层结构全都是为了支持这一层查询评估(Query Evaluation),它处于最顶层。 ![查询评估的架构](https://img2023.cnblogs.com/blog/2306858/202307/2306858-20230701235615819 阅读全文
摘要:
# Join 实现 > Join 简介 数据库管理系统是一个用以存储,结合(Combine)和过滤(Filter)信息的引擎。Join($\bowtie$)就是最主要的结合信息的方法。Join 操作非常重要,但是成本也可能非常高。最普遍的 Join 就是等价 Join,例如 $R.pk=S.fk$。 阅读全文
摘要:
# 索引(Indexing) > 索引分类 索引就是 $(keyVal,tupleID)$ 对构成的文件。 ![索引文件的形式](https://img2023.cnblogs.com/blog/2306858/202306/2306858-20230629234040372-2085506906. 阅读全文
摘要:
# 选择(Selection) 选择:`select * from R where C`,从一个关系 R 中过滤元组,得到符合条件 C 的子集。 选择操作根据选择条件可以分为三大类: * 1-d:一维的,也就是选择条件只基于一个属性 * n-d:多维的,也就是选择条件基于多个属性 * similar 阅读全文
摘要:
# 关系操作 ![关系操作](https://img2023.cnblogs.com/blog/2306858/202306/2306858-20230627002013971-93942362.png) 关键术语: * 元组(tuple)= 在某些模式下收集数据值 $\cong$ 记录(recor 阅读全文
摘要:
# 存储管理 > 数据库管理系统的存储管理分级 ![存储管理分级](https://img2023.cnblogs.com/blog/2306858/202306/2306858-20230624162358448-1629626691.png) 在数据库管理系统中存储管理的目的是: * 提供页或者 阅读全文
摘要:
# PostgreSQL 的架构 > 客户端/服务器架构: ![Client:server architecture](https://img2023.cnblogs.com/blog/2306858/202306/2306858-20230617224051150-773845544.png) * 阅读全文