6.5840: Distributed Systems
相关信息
课程链接: https://pdos.csail.mit.edu/6.824/schedule.html
Next Step:
- 7.20 GFS video
- 7.19 GFS Paper
- 7.18 LEC 2
- 7.17 MapReduce paper, LEC 2 Preparation
- 7.16 MapReduce video
1. MapReduce
TODO:
papervideo- lab
基础设施需要考虑的三大方面: Storage, Communication, Computation
对这三个方面进行抽象,以屏蔽低层的分布式细节,降低client code的复杂性
设计分布式系统的三个方面:
- Performance
- Scalibility: 2x computers means 2x throughput
- Fault Tolenrance
Impl:Non-volatile storage,Replication- Avilibility: 如果错误发生,系统仍然可用
- Recoverability: 如果错误发生,待错误解决后,系统能够正确运行
- Consistency
强一致性和弱一致性
MapReduce
Google为了解决对网页建立索引的任务,希望建立一种分布式计算的框架,让普通程序员也能编写分布式任务。
以Word Count解释MapReduce的过程
将多个MapReduce Job组合起来构建一个pipeline
Google File System and Map workers in the same machine
Batch processing vs Streaming processing
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!
· 零经验选手,Compose 一天开发一款小游戏!