摘要: 分布式存储系统是为了解决单机存储所存在的容量、性能等瓶颈,以及可用性、扩展性等方面的问题,通过把数据分散存储在多台存储设备上,为大规模的存储应用提供大容量、高性能、高可用、扩展性好的存储服务。这一系列的文章介绍一种典型的分布式存储系统的设计和实现,该系统已经服务大量的业务,达到了数百T的存储量,经受 阅读全文
posted @ 2020-04-14 15:47 S流星 阅读(498) 评论(0) 推荐(0) 编辑
摘要: 在分布式存储系统中,数据需要分散存储在多台设备上,数据分片(Sharding)就是用来确定数据在多台存储设备上分布的技术。数据分片要达到三个目的: 分布均匀,即每台设备上的数据量要尽可能相近; 负载均衡,即每台设备上的请求量要尽可能相近; 扩缩容时产生的数据迁移尽可能少。 数据分片方法 数据分片一般 阅读全文
posted @ 2020-04-14 15:46 S流星 阅读(461) 评论(0) 推荐(0) 编辑
摘要: 在NoSQL存储系统中,一般都采用Key-Value的数据类型,Key-Value结构简单,易于存储,非常适合分布式NoSQL存储系统。但简单的数据类型对业务存储的数据就有一定的局限性,比如需要存储列表类型的数据。针对这个问题,系统对Key-Value类型的数据做了一些扩展,支持在一个Key下存储多 阅读全文
posted @ 2020-04-14 15:45 S流星 阅读(339) 评论(0) 推荐(0) 编辑
摘要: 在分布式存储系统中,系统可用性是最重要的指标之一,需要保证在机器发生故障时,系统可用性不受影响,为了做到这点,数据就需要保存多个副本,并且多个副本要分布在不同的机器上,只要多个副本的数据是一致的,在机器故障引起某些副本失效时,其它副本仍然能提供服务。本文主要介绍数据备份的方式,以及如何保证多个数据副 阅读全文
posted @ 2020-04-14 15:43 S流星 阅读(863) 评论(0) 推荐(0) 编辑