云存储的那些事(1)——数据冗余
概要
关于云存储,可以学习的内容有很多,知识点也很杂,串联起来不容易;根据我的经验,带着问题去研究,从多个角度去理解才能记忆深刻。
本章开始,先探讨一些关于云存储的一些比较重要的问题和知识点,分为多期,化繁为简,希望可以对自己的学习做一个总结。
内容大致包括:
1,云存储的数据冗余方案
2,ceph系统架构与部署
3,数据分发策略的核心——crush算法
4,kvm环境下云主机与存储的结合方式
5,openstack对云存储的实现与支持
关键词:数据冗余、分布式存储、EC、副本
本节先看云存储的数据冗余方式:
云存储的方案大多采用对象存储的方式,并且对外采用了REST API接口提供服务的方式。
特点是:分布式、无单点故障、自愈性、优秀的扩展能力
对于数据可靠性的保障有一个很重要的方法就是数据冗余
数据冗余的技术通常有2种:副本技术、EC(erasure coding)纠删码技术
下图展示了2种技术的具体方案和常见的分布式系统所采用的参数规格。
下节介绍ceph系统如何处理数据分布的关键算法CRUSH。