FastDFS架构
1、什么是 FastDFS
FastDFS是用c语言编写的一款开源的分布式文件系统。FastDFS为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。
2、FastDFS架构
FastDFS架构包括 Tracker server和Storage server。客户端请求Tracker server进行文件上传、下载,通过Tracker server调度最终由Storage server完成文件上传和下载。
Tracker server作用是负载均衡和调度,通过Tracker server在文件上传时可以根据一些策略找到Storage server提供文件上传服务。可以将tracker称为追踪服务器或调度服务器。
Storage server作用是文件存储,客户端上传的文件最终存储在Storage服务器上,Storage server没有实现自己的文件系统而是利用操作系统 的文件系统来管理文件。可以将storage称为存储服务器。
Client:就是用来写 java 代码,调用 FastDFS API 控制文件上传下载层( 如果你是 java 开发,你只需要关心着一层)。
Tracker:管理集群的层,tracker也可以实现集群。每个tracker节点地位平等。
Storage:实际保存文件的层。
Storage分为多个组( 卷1、卷2、卷n ),每个组之间保存的文件是不同的。每个组内部可以有多个成员,组成员内部保存的内容是一样的,组成员的地位是一致的,没有主从的概念。
3、文件上传的流程
1、Storage Server 定时向 Tracker Server 发送自己的存储信息
2、Client 调用 FastDFS API 发送上传连接请求给 Tracker Server
3、Tracker Server 查询可用的 Storage Server 信息
4、’Tracker Server 将该信息( Storage 的 ip 和端口号 )返回给 Client
5、Client 调用 FastDFS API 上传文件给 Storage Server
6、Storage Server 生成文件 id ( file_id )
7、Storage Server 将上传内容写入磁盘
8、Storage Server 返回 file_id 给 Client
9、Client 层将存储文件信息写入数据库
4、文件存储目录信息
客户端上传文件后存储服务器将文件ID返回给客户端,此文件ID用于以后访问该文件的索引信息。文件索引信息包括:组名,虚拟磁盘路径,数据两级目录,文件名。
group1( 组名 ):文件上传后所在的storage组名称,在文件上传成功后有storage服务器返回,需要客户端自行保存。
M00( 虚拟磁盘路径 ):storage配置的虚拟路径,与磁盘选项store_path*对应。如果配置了store_path0则是M00,如果配置了store_path1则是M01,以此类推。
/02/04( 数据两级目录 ):storage服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据文件。( 因为文件太多放在一个目录下的话容易卡死 )
文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储服务器IP地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。
5、文件下载
1、Storage Server 定时向 Tracker Server 发送自己的存储信息
2、Client 调用 FastDFS API 发送下载连接请求给 Tracker Server
3、Tracker Server 查询可用的 Storage Server 信息( 检验同步状态 )
4、’Tracker Server 将该信息( Storage 的 ip 和端口号 )返回给 Client
5、Client 调用 FastDFS API 发送 file_id( 组名、路劲、文件名 ) 给 Storage Server
6、Storage Server 通过 file_id 查找文件
7、Storage Server 将 查找到的文件( file_content ) 返回给 Client