cassandra权威指南读书笔记--cassandra概述

cassandra是一个开源的、分布式、去中心化、弹性可扩展、高可用、容错、可调一致性、面向行数据库,分布式设计基于Amazon Dynamo,数据模型基于Google BigTable。cassandra由facebook创建。
AP数据库
去中心化,P2P(peer to peer,对等网络)协议,使用Gossip来维护和同步一个存活或者死亡列表。
弹性可扩展,水平扩展简单,自动数据迁移,几乎不影响现有访问。
高可用、容错:不存在单点故障问题。扩容缩容更简单。防灾,天然支持多AZ(area zone)
可调一致性。
分布式数据库设计者必须做出选择:要么总是可读,要么总是可写。cassandra和dynamo选择总是可写。
分布式系统一般必须选择AP和CP其中之一。
CA:比如使用2PC,但是出现网络分区,可能不一致,甚至不可用。
一个分区的行数据库。数据存储在稀疏的多维哈希表中。一行可以有任意多的列,不需要每一行都有所有列。
分区是指每一行都有一个唯一的键,用这个键来访问这一行的数据。用分区键将行分布到多个数据存储系统中。
cassandra将数据存储在一个多为的有序hash表中,在各列存储数据时,数据会作为哈希表的一个单独条目存储。列值按照一个一致的有序顺序存储,忽略未填充的列,这使得可以更高效的存储和查询。
使用类sql的语言,上手简单。
paxos共识协议的轻量级事务。
3.0开始重写底层存储引擎,与CQL结构更贴合。增加物化视图(也叫全局索引)的支持。

支持大量写操作、统计和分析。能够高并发处理大量写操作。
cassandra默认把键空间,表,列名处理为小写。

posted @ 2020-07-07 00:59  DevinDC  阅读(179)  评论(0编辑  收藏  举报