摘要:
目录 一、MapReduce/Hadoop 1.编程模型 2.系统实现 3.典型算法 二、Microsoft Dryad (本文为陈世敏老师课程笔记) 一、MapReduce/Hadoop Google 2014年推出。 1.编程模型 整体思路:程序员串行写程序 ,系统分布式并行完成,但要有很多限制 阅读全文
摘要:
目录 一、同步图计算 1.图算法 2.同步图计算 3.系统实现 二、异步图计算 1.数据模型 2.计算过程 (本文为陈世敏老师课程笔记) 一、同步图计算 1.图算法 PageRank:随机游走模拟网页浏览得到网页重要度排名,从1/N初始化,直到公式收敛 (1-d)/n是任意跳转的概率,后面的邻居通过 阅读全文
摘要:
目录 一、Document Store 1.数据模型 1.1 Json 1.2 Google Protocol Buffer 2.MongoDB 2.1 API and Query Model 2.2 Architecture 二、图存储系统 1.图数据模型 2.Neo4j 3.RDF和Sparql 阅读全文
摘要:
key value store、Distributed Coordination 阅读全文
摘要:
目录 一、分布式系统基本概念 1.网络通信协议 2.通信方式 3.分布式系统类型 4.故障类型 5.CAP 二、分布式文件系统 1.NFS 2.AFS 三、google File System \HDFS (本文为陈世敏老师的课程笔记) 一、分布式系统基本概念 1.网络通信协议 1.1 OSI模型 阅读全文
摘要:
目录 一、事务处理 1.ACID 2.Concurrency Control并发控制 3.Crash Recovery 崩溃恢复保证Durability 二、数据仓库 1.OLPA 2.行式与列式数据库 三、分布式数据库 (本文是中科院陈世敏老师课程学习笔记) 一、事务处理 1.ACID 数据库 事 阅读全文
摘要:
目录 一、数据库系统架构 二、数据存储与访问 1.数据库与文件系统对比总结 2.存储单位 2.1 硬盘 2.2 文件系统 2.3 RDSBM 3.访问策略 3.1 顺序访问 3.2 Indexing 3.3 Buffer Pool 3.4 join运算三种Query Plan (本文是中科院陈世敏老 阅读全文
摘要:
目录 一、几个定义注意点 二、SQL操作语句备忘录 三、补充SQL约束 (本文是中科院陈世敏老师课程学习笔记) 一、几个定义注意点 1.Scheme 对表格每一列的类型声明,只需定义一次 eg:新建表格定义scheme create table Student ( ID integer, Name 阅读全文