【存储】下一代分布式文件系统 研究
下一代分布式文件系统
上一代的缺点
元数据存在后端:I/O路径长、同步和互锁机制
上一代的分布式文件系统,由于当时的硬件限制,为了解决元数据的容量瓶颈,部分产品(如CephFS)将元数据保存在后端的RADOS集群里,I/O路径长,并且由于复杂的同步和互锁机制,性能损耗较高,性价比并不理想;
部分产品(如HDFS)采用内存来保存所有的元数据,虽然元数据性能较好,但由于内存的容量有限,系统支持的文件数比较少,扩展能力有限。
下一代改进
新存储介质:SSD (NVMe协议)(Non Volatile Memory Express)
存储引擎:高性能LSM存储引擎
新网络模块:高速网络传输模块,原生为RoCE/RDMA高性能网络量身打造
NVMe协议的出现,大大降低接口协议的开销,SCM(存储级内存)的出现,大大提升介质的性能,加上颗粒成本的下降,使得5TB以上的大容量NVMe SSD较为普遍。
利用最新的多核CPU、大容量和高性能NVMe SSD,只需要3个全闪存元数据高可用节点(可以共用数据节点),就可以高效保存和处理100亿数量文件规模的数据,同时提供每秒上百万元数据读写请求处理能力,具有极高的性价比。
· 基于最新一代NVMe/SCM存储介质设计,充分发挥出新兴介质近百万级IOPS和数GB带宽的性能优势,轻松满足对于文件系统的高频率元数据访问需求;
· 利用高性能LSM存储引擎,结合XSKY独有专利技术的键值设计,构建出完全自主的元数据服务;既兼容POSIX文件语义和S3对象语义,又支持用户/用户组、权限/ACL、扩展属性等;
· 元数据在本节点的日志保护和节点间的强一致性复制,使得元数据集群轻松应对慢盘、网络异常、节点重启/掉电等故障场景,提供RPO=0的元数据通路;
· 使用XSKY自研的高速网络传输模块,原生为RoCE/RDMA高性能网络量身打造,大大降低节点间元数据复制包的传输时延,使得整个元数据集群拥有更高的IOPS性能。
XGFS分布式文件存储系统由元数据服务集群和混合盘数据服务共同组成,使得该产品继承了XSKY多年在分布式混合盘上的深厚积累以及大规模存储运维能力:
多级缓存技术、支持副本与EC纠删码、支持延展集群双活、硬盘和网络亚健康处理等,成熟稳定,特性丰富且运维简单。
XSKY星辰天合发布全新下一代分布式文件系统XGFS
全球将有80%的数据是非结构化的。文件协议是存取非结构化数据最普遍的使用方式,根据IDC统计,2019年度,中国的软件定义存储市场约60%是文件存储。
传统文件系统
传统文件系统有很多的限制:
1、元数据和数据使用本地存储,无法横向扩展,不具备节点级高可用;
2、受限于元数据的存储空间和性能,实际可保存的文件数有限,一般小于1亿,存储空间为TB级别;
3、非统一命名空间,多个挂载目录之间无法互通,使用复杂;
4、文件存储网关不可扩展,无法提升带宽,造成访问瓶颈;
5、不支持大数据和容器等新业务。
分布式文件存储
分布式文件存储,最复杂的就是元数据的保存和处理。根据统计,大部分的AI/ML分析应用,90%的I/O都是请求元数据操作。
上一代的分布式文件系统,由于当时的硬件限制,为了解决元数据的容量瓶颈,部分产品(如CephFS)将元数据保存在后端的RADOS集群里,I/O路径长,并且由于复杂的同步和互锁机制,性能损耗较高,性价比并不理想;
部分产品(如HDFS)采用内存来保存所有的元数据,虽然元数据性能较好,但由于内存的容量有限,系统支持的文件数比较少,扩展能力有限。
有没有一种架构,能够以较低的成本,极简的架构,满足现代文件系统元数据处理的性能和容量要求?
现在,大容量高速SSD的普及,使得鱼和熊掌兼得变成现实。NVMe协议的出现,大大降低接口协议的开销,SCM(存储级内存)的出现,大大提升介质的性能,加上颗粒成本的下降,使得5TB以上的大容量NVMe SSD较为普遍。
这些SSD新技术的发展,加上CPU的核数越来越多,使得全闪存元数据节点完全可以应对大规模文件系统的需求,比如,只需要5TB的NVMe SSD的元数据空间,就可以轻松保存和处理百亿规模文件。
02XGFS重新定义下一代分布式文件系统
XGFS(XSKY Global File System)是XSKY提供的新一代分布式文件存储系统,具有单一全局的命名空间。
XGFS基于灵活的SDS架构,支持NFS、SMB、FTP、POSIX、HDFS、Kubernetes CSI(容器存储接口)等丰富的协议,不仅可以用于企业的文件共享,备份归档通用场景,也可以应用于视频监控、媒资管理、高性能计算等高性能、大带宽、大容量的场景, 还支持最新的大数据和容器场景。
XGFS企业级分布式存储系统架构图
XGFS创新利用最新的多核CPU、大容量和高性能NVMe SSD,只需要3个全闪存元数据高可用节点(可以共用数据节点),就可以高效保存和处理100亿数量文件规模的数据,同时提供每秒上百万元数据读写请求处理能力,具有极高的性价比。
而XGFS的数据节点,则充分利用XSKY久经市场考验的可靠自主分布式存储集群,成熟稳定,可以轻松扩展到上千个节点。
XGFS企业级分布式存储系统用户界面
XGFS元数据服务的架构具有如下优势:
· 基于最新一代NVMe/SCM存储介质设计,充分发挥出新兴介质近百万级IOPS和数GB带宽的性能优势,轻松满足对于文件系统的高频率元数据访问需求;
· 利用高性能LSM存储引擎,结合XSKY独有专利技术的键值设计,构建出完全自主的元数据服务;既兼容POSIX文件语义和S3对象语义,又支持用户/用户组、权限/ACL、扩展属性等;
· 元数据在本节点的日志保护和节点间的强一致性复制,使得元数据集群轻松应对慢盘、网络异常、节点重启/掉电等故障场景,提供RPO=0的元数据通路;
· 使用XSKY自研的高速网络传输模块,原生为RoCE/RDMA高性能网络量身打造,大大降低节点间元数据复制包的传输时延,使得整个元数据集群拥有更高的IOPS性能。
XGFS分布式文件存储系统由元数据服务集群和混合盘数据服务共同组成,使得该产品继承了XSKY多年在分布式混合盘上的深厚积累以及大规模存储运维能力:
多级缓存技术、支持副本与EC纠删码、支持延展集群双活、硬盘和网络亚健康处理等,成熟稳定,特性丰富且运维简单。
03产品特点
1、全局命名空间
· 单一命名空间:提供统一持续高性能的文件单一全局命名空间,使用简单;
· 丰富的协议支持:支持NFS, SMB, POSIX, FTP, HDFS,Kubernetes CSI等协议, 简化业务IT架构的同时解除对业务的锁定;
· 新兴业务场景支持:支持HPC、大数据和容器等新兴负载。
2、灵活扩展
· 软件定义,可自定义节点属性,并支持各种品牌的通用x86服务器和国产服务器;
· 灵活部署,可从3个节点扩展到4096个节点,满足不同业务需求;
· 按需扩展,性能和容量随节点数增加而增长,满足不断增长的业务对性能和容量的需求。
3、丰富的企业级功能
· 数据冗余:支持多副本和EC不同冗余策略,提供基于服务器、机架、数据中心的三个级别故障域管理。支持快照保护;
· 支持文件网关负载均衡和HA保护,支持AD域、LDAP域对接,本地认证等多种认证方式。支持配额管理;
· 通过内嵌X3DS可以实现文件和对象间的复制、迁移、备份、归档等丰富的数据管理功能,并且支持阿里云和百度云等公有云平台。
04典型应用场景
XGFS可以作为企业级分布式文件系统,支持丰富的大容量非结构化数据保存和分析场景:
1、文件共享、企业办公存储
单一全局命名空间,使用简单。支持文件共享、网盘、FTP等办公场景。
2、视频监控、流媒体、CDN存储
横向扩展,滚动升级,数据永久保存。
3、大数据、HPC后端存储
兼容HDFS, 高效文件元数据处理机制,灵活应对AI/ML数据分析要求。
4、容器共享存储
支持Kubernetes CSI接口,支持多个PODs共享数据。
5、集中灾备资源池
利用X3DS(XSKY立体数据管理系统)和,可以作为大容量的共享灾备资源池。
6、企业数据湖底座
支持Hadoop存算分离部署,接口协议丰富,可以扩展到上千节点。
XSKY XGFS充分利用SDS优势,适配最新的NVMe SSD新技术,支持最新的HDFS和Kubernetes CSI协议,性价比高,无需在性能和容量之间做出妥协,是企业的数据湖建设的理想底座。