Cassandra 介绍

本篇收录于 Cassandra 学习笔记系列

简介

Cassandra 是一个开源的,分布式,无中心,弹性可扩展,高可用,容错,一致性可调,面向列的数据库。 他基于 Amazon Dynamo 的分布式设计和 Google BigTable 的数据模型,由 Facebook 创建,已经在一些最流行的网站中取得了应用。

是一种NoSQL类型的数据库。

所谓单点故障就是指:指系统中一点失效,就会让整个系统无法运作的部件,换句话说,单点故障即会整体故障。

NoSQL数据库(又称非关系型数据库)是一种数据库,它提供一种机制来存储和检索数据,而不是关系数据库中使用的表格关系。这些数据库是无架构的,支持简单的复制,具有简单的API,最终一致,并且可以处理大量的数据。

为什么选择cassandra

  • 线性扩展,轻松应对速度,多样性和复杂性问题

    • 与下一代云应用相关的许多挑战都集中在数据量和数据处理速度上。Cassandra能否有能力应对这种具有多样性的数据流量?答案是肯定的,Cassandra是线性扩展,可以根据前台数据流量轻松确定集群规模,处理能力不够?加一台节点试试。

  • 可以处理大量数据集

  • 高度容错

    • Cassandra采用了许多容错机制。由于C* 是无主的,所以没有单点故障。可以做到不停服滚动升级。这是因为Cassandra可以支持多个节点的临时失效(取决于群集大小),对群集的整体性能影响可以忽略不计。
    • Cassandra提供多地域容灾。Cassandra允许您将数据复制到其他数据中心,并在多个地域保留多副本。除了作为强大的灾难恢复和业务连续性保障之外,这有助于满足许多监管,离线分析等要求。
  • 易于集成其他开源组件

    • Cassandra可以很容易的跟其他开源组件做集成。据我所知,cassandra已经成功跟kafka,spark,solr做集成,打通了大数据生态上下游,成为大数据处理里面重要的一环

特点

弹性可扩展性 - Cassandra是高度可扩展的; 它允许添加更多的硬件以适应更多的客户和更多的数据根据要求。

始终基于架构 - Cassandra没有单点故障,它可以连续用于不能承担故障的关键业务应用程序。

快速线性性能 - Cassandra是线性可扩展性的,即它为你增加集群中的节点数量增加你的吞吐量。因此,保持一个快速的响应时间。

灵活的数据存储 - Cassandra适应所有可能的数据格式,包括:结构化,半结构化和非结构化。它可以根据您的需要动态地适应变化的数据结构。

便捷的数据分发 - Cassandra通过在多个数据中心之间复制数据,可以灵活地在需要时分发数据。

事务支持 - Cassandra支持属性,如原子性,一致性,隔离和持久性(ACID)。

快速写入 - Cassandra被设计为在廉价的商品硬件上运行。 它执行快速写入,并可以存储数百TB的数据,而不牺牲读取效率。

posted @ 2021-03-21 10:02  YanyuWu  阅读(332)  评论(0编辑  收藏  举报