NoSQL数据库与关系数据库的比较

SQL，即结构化查询语言，是传统的关系型数据库的查询语言。SQL数据库能够通过简化CRUD操作，处理数据库中的结构化数据。此处的CRUD代表了创建(create)、检索(或读取，retrieve、read)、更新(update)和删除(delete)，四种控制数据的主要操作。

　　SQL数据库通常被称为关系型数据库管理系统(RDBMS)。由于此类系统主要利用基于行的数据库结构，连接各个数据表之间的相关数据对象，因此传统的RDBMS使用的是SQL语法。我们熟悉的Microsoft Access、MySQL、Microsoft SQL Server、SQLite、Oracle Database、IBM DB2、以及Backendless等都是RDBMS类型的SQL数据库。

　　而NoSQL数据库并没有任何固定用于保存数据的结构化数据表。从技术上讲，所有非关系型数据库都可以被称为NoSQL数据库。不同于关系型数据库，NoSQL数据库不但可以被快速地设置，并且只需最少量的预先规划(pre-planning)。常见的NoSQL数据库示例包括：MongoDB、DynamoDB、SimpleDB、CouchDB、CouchBase、OrientDB、InfiniteGraph、Neo4j、FlockDB、Cassandra、以及HBase等。

NoSQL是一种不同于关系数据库的数据库管理系统设计方式，是对非关系型数据库的统称，它所采用的数据模型并非传统关系数据库的关系模型，而是类似键/值、列族、文档等非关系模型。NoSQL数据库没有固定的表结构，通常也不存在连接操作，也没有严格遵守ACID约束。因此，与关系数据库相比，NoSQL具有灵活的水平可扩展性，可以支持海量数据存储。

什么是ACID?

事务的原子性(Atomicity)：是指一个事务要么全部执行，要么不执行，也就是说一个事务不可能只执行了一半就停止了。比如你从取款机取钱，这个事务可以分成两个步骤：1划卡，2出钱。不可能划了卡，而钱却没出来。这两步必须同时完成，要么就不完成。
事务的一致性(Consistency)：是指事务的运行并不改变数据库中数据的一致性。例如，完整性约束了a+b=10，一个事务改变了a，那么b也应该随之改变。
独立性(Isolation）：事务的独立性也有称作隔离性，是指两个以上的事务不会出现交错执行的状态。因为这样可能会导致数据不一致。
持久性(Durability）：事务的持久性是指事务执行成功以后，该事务对数据库所作的更改便是持久的保存在数据库之中，不会无缘无故的回滚
NoSQL数据库的特点
（1）灵活的可扩展性

传统的关系型数据库由于自身设计机理的原因，通常很难实现“横向扩展”，在面对数据库负载大规模增加时，往往需要通过升级硬件来实现“纵向扩展”。NoSQL数据库在设计之初就是为了满足“横向扩展”的需求，因此天生具备良好的水平扩展能力。

（2）灵活的数据模型

关系数据库具有规范的定义，遵守各种严格的约束条件。这种做法虽然保证了业务系统对数据一致性的需求，但是过于死板的数据模型，也意味着无法满足各种新兴的业务需求。相反，NoSQL数据库采用键/值、列族等非关系模型，允许在一个数据元素里存储不同类型的数据。

（3）与云计算紧密融合

云计算具有很好的水平扩展能力，可以根据资源使用情况进行自由伸缩，各种资源可以动态加人或退出，NoSQL数据库可以凭借自身良好的横向扩展能力，充分自由利用云计算基础设施，很好地融人到云计算环境中，构建基于NoSQL的云数据库服务。

NoSQL兴起的原因
1、关系数据库已经无法满足Web2.0的需求。主要表现在以下几个方面：

（1）无法满足海量数据的管理需求

对于上述网站而言，很快就可以产生超过10亿条的记录，对于关系数据库来说，在一张10亿条记录的表里进行SQL查询，效率极其低下。

（2）无法满足数据高并发的需求

（3）无法满足高可扩展性和高可用性的需求

2.关系数据库的关键特性在Web 2.0时代成为“鸡肋”

关系数据库的关键特性包括完善的事务机制和高效的查询机制。但是，关系数据库引以为傲的两个关键特性，到了Web2.0时代却成了鸡肋，主要表现在以下几个方面：

（1） Web 2.0网站系统通常不要求严格的数据库事务

对于许多Web 2.0网站而言，数据库事务已经不是那么重要。数据库事务通常有一套复杂的实现机制来保证数据库一致性，需要大量系统开销，对于包含大量频繁实时读写请求的Web 2.0网站而言，实现事务的代价是难以承受的。

（2）Web 2.0并不要求严格的读写实时性

对于关系数据库而言，一旦有一条数据记录成功插人数据库中，就可以立即被查询。

对于Web 2.0而言，没有这种实时读写需求。

（3）Web 2.0通常不包含大量复杂的SQL查询

复杂的SQL查询通常包含多表连接操作。但是，Web 2.0网站在设计时就已经尽量减少甚至避免这类操作，通常只采用单表的主键查询，因此关系数据库的查询优化机制在Web 2.0中也就难以有所作为。

NoSQL与关系数据库的比较
RDBMS：关系数据库

1.NoSQL与关系数据库比较小结：

（1）关系数据库

优势：以完善的关系代数理论作为基础，有严格的标准，支持事务ACID四性，借助索引机制可以实现高效的查询，技术成熟，有专业公司的技术支持

劣势：可扩展性较差，无法较好支持海量数据存储，数据模型过于死板、无法较好支持Web2.0应用，事务机制影响了系统的整体性能等

（2）NoSQL数据库

优势：可以支持超大规模数据存储，灵活的数据模型可以很好地支持Web2.0应用，具有强大的横向扩展能力等

劣势：缺乏数学理论基础，复杂查询性能不高，大都不能实现事务强一致性，很难实现数据完整性，技术尚不成熟，缺乏专业团队的技术支持，维护较困难等

（3）关系数据库和NoSQL数据库各有优缺点，彼此无法取代

关系数据库应用场景：电信、银行等领域的关键业务系统，需要保证强事务一致性

NoSQL数据库应用场景：互联网企业、传统企业的非关键业务（比如数据分析）

采用混合架构

案例：亚马逊公司就使用不同类型的数据库来支撑它的电子商务应用
对于“购物篮”这种临时性数据，采用键值存储会更加高效
当前的产品和订单信息则适合存放在关系数据库中
NoSQL的四大类型
NoSQL数据库虽然数量众多，但是，归结起来，典型的NoSQL数据库通常包括键值数据库、列族数据库、文档数据库和图形数据库

1.键值数据库

键值数据库(Key-Value Database) 的表中有一个特定的Key和一个指针指向特定的Value。Key可以用来定位Value，即存储和检索具体的Value。Value对数据库而言是透明不可见的，不能对Value进行索引和查询，只能通过Key进行查询。Value可以用来存储任意类型的数据，包括整型、字符型、数组、对象等。

应用场景:一个面向会话的应用程序（如 Web 应用程序）在用户登录时启动会话，并保持活动状态直到用户注销或会话超时。在此期间，应用程序将所有与会话相关的数据存储在主内存或数据库中。会话数据可能包括用户资料信息、消息、个性化数据和主题、建议、有针对性的促销和折扣。每个用户会话具有唯一的标识符。除了主键之外，任何其他键都无法查询会话数据，因此快速键值存储更适合于会话数据。一般来说，键值数据库所提供的每页开销可能比关系数据库要小。

2.列族数据库

3.文档数据库

4.图形数据库

5.不同类型数据库比较分析

MySQL：产生年代较早，而且随着LAMP大潮得以成熟。尽管其没有什么大的改进，但是新兴的互联网使用的最多的数据库
MongoDB：是个新生事物，提供更灵活的数据模型、异步提交、地理位置索引等五花十色的功能
HBase：是个“仗势欺人”的大象兵。依仗着Hadoop的生态环境，可以有很好的扩展性。但是就像象兵一样，使用者需要养一头大象(Hadoop),才能驱使他
Redis：是键值存储的代表，功能最简单。提供随机数据存储。就像一根棒子一样，没有多余的构造。但是也正是因此，它的伸缩性特别好。就像悟空手里的金箍棒，大可捅破天，小能成缩成针
NoSQL的三大基石

所谓的CAP指的是：

C（Consistency）：一致性，是指任何一个读操作总是能够读到之前完成的写操作的结果，也就是在分布式环境中，多点的数据是一致的，或者说，所有节点在同一时间具有相同的数据
A:（Availability）：可用性，是指快速获取数据，可以在确定的时间内返回操作结果，保证每个请求不管成功或者失败都有响应；
P（Tolerance of Network Partition）：分区容忍性，是指当出现网络分区的情况时（即系统中的一部分节点无法和其他节点进行通信），分离的系统也能够正常运行，也就是说，系统中任意信息的丢失或失败不会影响系统的继续运作。
CAP理论告诉我们，一个分布式系统不可能同时满足一致性、可用性和分区容忍性这三个需求，最多只能同时满足其中两个，正所谓“鱼和熊掌不可兼得”。

当处理CAP的问题时，可以有几个明显的选择：

CA：也就是强调一致性（C）和可用性（A），放弃分区容忍性（P），最简单的做法是把所有与事务相关的内容都放到同一台机器上。很显然，这种做法会严重影响系统的可扩展性。传统的关系数据库（MySQL、SQL Server和PostgreSQL），都采用了这种设计原则，因此，扩展性都比较差
CP：也就是强调一致性（C）和分区容忍性（P），放弃可用性（A），当出现网络分区的情况时，受影响的服务需要等待数据一致，因此在等待期间就无法对外提供服务
AP：也就是强调可用性（A）和分区容忍性（P），放弃一致性（C），允许系统返回不一致的数据

BASE
前面说到ACID ，现在浅谈一下BASE（Basically Availble, Soft-state, Eventual consistency）

ACID

BASE

原子性(Atomicity)

基本可用(Basically Available)

一致性(Consistency)

软状态/柔性事务(Soft state)

隔离性(Isolation)

最终一致性 (Eventual consistency)

持久性 (Durable)

BASE的基本含义是基本可用（Basically Availble）、软状态（Soft-state）和最终一致性（Eventual consistency）：

基本可用
基本可用，是指一个分布式系统的一部分发生问题变得不可用时，其他部分仍然可以正常使用，也就是允许分区失败的情形出现

软状态
“软状态（soft-state）”是与“硬状态（hard-state）”相对应的一种提法。数据库保存的数据是“硬状态”时，可以保证数据一致性，即保证数据一直是正确的。“软状态”是指状态可以有一段时间不同步，具有一定的滞后性

最终一致性

一致性的类型包括强一致性和弱一致性，二者的主要区别在于高并发的数据访问操作下，后续操作是否能够获取最新的数据。对于强一致性而言，当执行完一次更新操作后，后续的其他读操作就可以保证读到更新后的最新数据；反之，如果不能保证后续访问读到的都是更新后的最新数据，那么就是弱一致性。而最终一致性只不过是弱一致性的一种特例，允许后续的访问操作可以暂时读不到更新后的数据，但是经过一段时间之后，必须最终读到更新后的数据。

MongoDB基本操作
1.打开或者创建一个表，表名为xmu0134

use xmu0134

2.创建集合student

MongoDB没有单独创建集合名的命令，在插入数据的时候，Mongodb会自动创建对应的集合。MongoDB也不用去设计表，避免了像关系型数据库设计表时的麻烦和复杂。

3.插入数据

这里举个实例，插入集合Student，代码如下：

var data = [
... ... {Sno:95001,Sname:"李勇",Ssex:"男",Sage:20,Sdept:"CS"},
... ... {Sno:95002,Sname:"刘晨",Ssex:"女",Sage:19,Sdept:"IS"},
... ... {Sno:95003,Sname:"王敏",Ssex:"女",Sage:18,Sdept:"MA"},
... ... {Sno:95004,Sname:"张立",Ssex:"男",Sage:19,Sdept:"IS"}
... ... ]

db.Student.insert(data)

4.查询数据

db.Student.find();//查询所有数据
db.Student.find({Sno:95001});//条件查询

id是MongoDB自有产物，存储在集合中每个文档都有一个默认的主键_id,名称固定，同一个集合中文档_id的值必须是唯一的，不能重复。

5.增加数据

给学号为95003的学生添加课程成绩信息，Cno:2,Grade:68;Cno:3,Grade:75;

给学号为95004的学生添加课程成绩信息，Cno:3,Grade:97

6.查询数据

查询拥有课程3的学生，其中还有其他的逻辑表达查询这里不一一列出，可以自行搜索

Redis基本操作
1.增添数据

为学号为95001的学生选择三门课

2.查询数据

查询学号为95001学生选择的课程

3.条件查询

查询李勇和刘晨所选的公共课程名

4.更多

更多详细的shell命令，可以看这篇文章，点赞👍http://t.csdn.cn/vw7sI
参考：https://blog.csdn.net/wulj666/article/details/125380286

https://blog.csdn.net/qq_35005735/article/details/123895607

posted @ 2022-09-29 19:47 konglingbin 阅读(1877) 评论(0) 收藏举报

刷新页面返回顶部

konglingbin

NoSQL数据库与关系数据库的比较

公告