FastDFS分布式文件系统

什么是FastDFS

FastDFS 是用 c 语言编写的一款开源的分布式文件系统。FastDFS 为互联网量身定制, 充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用 FastDFS 很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。

FastDFS 架构包括 Tracker server 和 Storage server。客户端请求 Tracker server 进行文 件上传、下载,通过 Tracker server 调度最终由 Storage server 完成文件上传和下载。

  • Tracker server 作用是负载均衡和调度,通过 Tracker server 在文件上传时可以根据一些 策略找到 Storage server 提供文件上传服务。可以将 tracker 称为追踪服务器调度服务器

  • Storage server 作用是文件存储,客户端上传的文件最终存储在 Storage 服务器上, Storageserver 没有实现自己的文件系统而是利用操作系统 的文件系统来管理文件。可以将 storage 称为存储服务器

服务端两个角色:

  • Tracker: 管理集群,tracker 也可以实现集群。每个 tracker 节点地位平等。收集 Storage 集群的状态。
  • Storage: 实际保存文件, Storage 分为多个组,每个组之间保存的文件是不同的。每 个组内部可以有多个成员,组成员内部保存的内容是一样的,组成员的地位是一致的,没有 主从的概念。

简单说

就是当用户上传图片的时候,它不会拿我们的文件名作为存储的根据,它会对应的选择一种算法,会把文件的指纹计算出来。在真正存储的时候,是拿指纹作为根据的。

而在解决拓展和备份的时候,它分为了两个部分 Tracker server 和 Storage server。Tracker server可以认为是一个调度中心,它去控制一个图片要去存储的话上传文件要放到哪一个Storage server来存储如果Storage server有一台机子挂了的话,它也能和Tracker server直接保持一个联系,会发现哪台机子挂掉了,然后用它的备份机器来用。Storage server是用来真实的存储数据的。它里面会有横向上和纵向上的设计。横向上标识它可以分为几个不同的组或者卷。所以的组保存了所有的数据,一个组只保存了一部分的数据。当进行拓展的话,加入一个新的存储,只需要安装Storage server的程序,然后告诉它被哪个Tracker server调度,那它就加入到了存储的大家庭了。纵向上是多台一起进行这个组的数据同步,不一定是一台,只需要加入一个配置好的机子,它就可以进行纵向的数据同步了。单个的Storager通过对外访问的能力又很差,所以,在每个Storager中安装了Nginx。当用户要这个图片的时候,直接和Storage要就可以了。

 文件上传流程

 

客户端上传文件后存储服务器将文件 ID 返回给客户端,此文件 ID 用于以后访问该文 件的索引信息。文件索引信息包括:组名,虚拟磁盘路径,数据两级目录,文件名。

 比如:

  • 组名:文件上传后所在的 storage 组名称,在文件上传成功后有 storage 服务器返回, 需要客户端自行保存。
  • 虚拟磁盘路径:storage 配置的虚拟路径,与磁盘选项 store_path*对应。如果配置了 store_path0 则是 M00,如果配置了 store_path1 则是 M01,以此类推。
  • 数据两级目录:storage 服务器在每个虚拟磁盘路径下创建的两级目录,用于存储数据 文件。
  • 文件名:与文件上传时不同。是由存储服务器根据特定信息生成,文件名包含:源存储 服务器 IP 地址、文件创建时间戳、文件大小、随机数和文件拓展名等信息。

 

posted @ 2018-07-11 18:13  苦行僧95  阅读(118)  评论(0编辑  收藏  举报