分布式文件服务 FastDFS
FastDFS 详细介绍
FastDFS是一个开源的分布式文件系统,她对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。特别适合以文件为载体的在线服务,如相册网站、视频网站等等。
FastDFS服务端有两个角色:跟踪器(tracker)和存储节点(storage)。跟踪器主要做调度工作,在访问上起负载均衡的作用。
存储节点存储文件,完成文件管理的所有功能:存储、同步和提供存取接口,FastDFS同时对文件的meta data进行管理。所谓文件的meta data就是文件的相关属性,以键值对(key value pair)方式表示,如:width=1024,其中的key为width,value为1024。文件meta data是文件属性列表,可以包含多个键值对。
特点
- 分组存储,灵活简洁。
- 对等结构,不存在单点。
- 文件ID由FastDFS生成,作为文件访问凭证。
- FastDFS已提供apache和nginx扩展模块。
- 大中小文件均可以很好支持,支持海量小文件存储。
- 存储服务器上可以保存文件附加属性。
- 不采用文件分割独立存储机制,保证同组内部存储节点均有完整副本。
逻辑结构
系统结构
跟踪器和存储节点都可以由一台多台服务器构成。跟踪器和存储节点中的服务器均可以随时增加或下线而不会影响线上服务。其中跟踪器中的所有服务器都是对等的,可以根据服务器的压力情况随时增加或减少。
为了支持大容量,存储节点(服务器)采用了分卷(或分组)的组织方式。存储系统由一个或多个卷组成,卷与卷之间的文件是相互独立的,所有卷 的文件容量累加就是整个存储系统中的文件容量。一个卷可以由一台或多台存储服务器组成,一个卷下的存储服务器中的文件都是相同的,卷中的多台存储服务器起 到了冗余备份和负载均衡的作用。
在卷中增加服务器时,同步已有的文件由系统自动完成,同步完成后,系统自动将新增服务器切换到线上提供服务。
当存储空间不足或即将耗尽时,可以动态添加卷。只需要增加一台或多台服务器,并将它们配置为一个新的卷,这样就扩大了存储系统的容量。
流程请求图
- tracker 内部采用内存缓存存储分组信息,因此定位存储分组效率很高。
- 关于文件同步延迟,导致文件定位失败,可通过Nginx fastDFS 模块重定向或源文件定位策略配置。
上传
上传文件交互过程:
- client 向 tracker 发起请求,获取有效的 storage。
- tracker返回一台可用的storage。
- client直接和storage通讯完成文件上传,最终返回文件标识。
下载
下载文件交互过程:
- client 根据文件标识向 tracker 发起请求,获取当前文件存储在哪台 storage。
- tracker返回一台可用的storage。
- client直接和storage通讯完成文件下载。