摘要:
# 前提条件 Spark 使用的语言是 Scala,而 Scala 需要运行在 JVM 之上。因此,搭建 Spark 的运行环境应该是 JDK 和 Scala。由于学习 Spark 源码的参考书籍是《Spark内核设计的艺术架构设计与实现》,所以就按照作者安装的版本进行安装: * Java8 * S 阅读全文
摘要:
# 事务处理 > 事务简介 事务是一个应用层面的操作 ,通过一系列的数据库操作执行。一个事务会影响数据库的状态。 ,它处于最顶层。 和过滤(Filter)信息的引擎。Join($\bowtie$)就是最主要的结合信息的方法。Join 操作非常重要,但是成本也可能非常高。最普遍的 Join 就是等价 Join,例如 $R.pk=S.fk$。 阅读全文
摘要:
# 索引(Indexing) > 索引分类 索引就是 $(keyVal,tupleID)$ 对构成的文件。  选择:`select * from R where C`,从一个关系 R 中过滤元组,得到符合条件 C 的子集。 选择操作根据选择条件可以分为三大类: * 1-d:一维的,也就是选择条件只基于一个属性 * n-d:多维的,也就是选择条件基于多个属性 * similar 阅读全文
摘要:
# 关系操作  关键术语: * 元组(tuple)= 在某些模式下收集数据值 $\cong$ 记录(recor 阅读全文
摘要:
# 存储管理 > 数据库管理系统的存储管理分级  在数据库管理系统中存储管理的目的是: * 提供页或者 阅读全文
摘要:
# PostgreSQL 的架构 > 客户端/服务器架构:  * 阅读全文