关系型数据库与非关系型数据库

1. 定义

  (1)关系型数据库

    指采用了关系模型来组织数据的数据库。关系模型指的就是二维表格模型,而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。

    pro:

    1.容易理解:二维表结构是非常贴近逻辑世界的一个概念,关系模型相对网状、层次等其他模型来说更容易理解
    2.使用方便:通用的SQL语言使得操作关系型数据库非常方便
    3.易于维护:丰富的完整性(实体完整性、参照完整性和用户定义的完整性)大大减低了数据冗余和数据不一致的概率

    con:

    1.网站的用户并发性非常高,往往达到每秒上万次读写请求,对于传统关系型数据库来说,硬盘I/O是一个很大的瓶颈

    2.效率低: 难以处理大量请求

    

    4.性能欠佳:

      多表的关联查询,以及复杂的数据分析类型的复杂SQL报表查询。为了保证数据库的ACID特性,必须尽量按照其要求的范式进行设计,关系型数据库中的表都是存储一个格式化的数据结构。

      ACID特性,ACID分别是Atomic原子性,Consistency一致性,Isolation隔离性,Durability持久性。

  (2)非关系型数据库

    指非关系型的,分布式的,且一般不保证遵循ACID原则的数据存储系统。

    非关系型数据库以键值对存储,且结构不固定,每一个元组可以有不一样的字段,每个元组可以根据需要增加一些自己的键值对,不局限于固定的结构,可以减少一些时间和空间的开销。

    Pro:

    1.灵活:可随意添加字段,仅需id即可取出相应的value

    2.便于升级:SNS(Social Networking Services)

    Con:

    不适用于复杂的查询数据

    =======================================================================

    分类:

    1)面向高性能并发读写的key-value数据库(map)

      主流代表为RedisAmazon DynamoDBMemcachedMicrosoft Azure Cosmos DBHazelcast

    2)面向海量数据访问的面向文档数据库(json)

      主流代表为MongoDBAmazon DynamoDBCouchbaseMicrosoft Azure Cosmos DBCouchDB

    3)面向搜索数据内容的搜索引擎

      主要是用于对海量数据进行近实时的处理和分析处理,可用于机器学习和数据挖掘
     主流代表为ElasticsearchSplunkSolrMarkLogicSphinx

    4)面向可扩展性的分布式数据库

      将数据存储在记录中,能够容纳大量动态列。由于列名和记录键不是固定的,并且由于记录可能有数十亿列,因此可扩展性存储可以看作是二维键值存储。

      主流代表为CassandraHBaseMicrosoft Azure Cosmos DBDatastax EnterpriseAccumulo

    CAP理论:C(Consistency)一致性,A(Availability)可用性,P(Partition tolerance)分区容错性


2. 对比
  1.成本:Nosql数据库:易部署,开源
  2.查询速度:
    Nosql数据库快:数据存储于缓存之中,而且不需要经过SQL层的解析,
    关系型数据库慢:数据存储在硬盘中。
  3.存储数据的格式:
    Nosql的存储格式多:key,value形式、文档形式、图片形式等等
    关系型数据库:仅支持基础类型。
  4.扩展性:
    Nosql基于键值对,数据之间没有耦合性,所以非常容易水平扩展。
    关系型数据库有类似join这样的多表查询机制的限制导致扩展很艰难。
  5.持久存储:
    Nosql不使用于持久存储
    关系型数据库适用
  6.数据一致性:
    非关系型数据库强调 数据最终一致性,不支持transaction
    关系型数据库强调数据的强一致性,从非关系型数据库中读到的有可能还是处于一个中间态的数据,
posted @ 2019-02-23 15:14  森淼clover  阅读(182)  评论(0编辑  收藏  举报