为什么会出现NoSQL数据库

一、总结

一句话总结：sql不支持分布式且且有性能瓶颈且不支持分布式，不同NoSQL适合不同的场景

1、"不同的NoSQL数据库只适合不同的场景"这句话对么？

对的，NoSQL数据库是针对点的，关系型数据库是针对面的

2、NoSQL数据库有哪四种？

①KV键值对：redis，内容缓存，主要用于处理大量数据的高访问负载等；
②bson：文档数据库，MongoDB 是一个基于分布式文件存储的数据库，C++编写的。皆在为web应用提供可扩展的高性能数据存储解决方案。它介于关系型数据库与非关系型数据库之间的产品，是非关系型中功能最丰富的，且最像关系型数据库的；
③列存储数据库：分布式文件系统
④图关系型数据库：它不是放图的，放的是关系：如朋友圈社交网络等。专注于关系图谱。

3、数据库主从复制和读写分离是什么？

主从复制：往主服务里插入一条数据的同时，也往从服务里写入一条数据（备份、容灾）
读写分离：一般主作为写（20%），从作为读（80%）

二、互联网背景下为什么会出现NoSQL？

一、传统应用模式（ALL IN ONE）

所有的东西都部署在一台机器上，包括站点、数据库、文件等等(现在阿里云的出现方便了很多)。核心工作就是：前端传过来一些数据，然后业务逻辑层拼装，然后访问数据库，数据库返回数据，数据拼装成页面，最终返回到浏览器。
这时候数据库可能会率先成为瓶颈，在流量峰值期容易宕机，第一可以优化sql语句，第二，典型的应用都是读数据库频率远大于写数据库频率。这时候可以采用读写分离，多读一写的数据库架构（一般是20%是写库，80%是读库）；

这时候的主要矛盾点已经变为业务复杂度的提升带来的耦合，导致升级困难，开发容易引入bug，维护成本也提升。

1、Memcached 分布式缓存服务器，通过文件缓存来缓解数据库压力，为多个web服务器提供了一个共享的高性能缓存服务。在Memcached服务器上，又发展了根据hash算法来进行多台Memcached缓存服务的扩展，然后又出现了一致性hash来解决增加或减少缓存服务器导致重新hash带来的大量缓存失效的弊端。

不足：
由于数据库的写入压力增加，Memcached只能缓解数据库的读取压力。读写集中在一个数据库上让数据库不堪重负，大部分网站开始使用主从复制技术来达到读写分离，以提高读写性能和读库的可扩展性。Mysql的master-slave模式成为这个时候的网站标配了。

2、主从复制读写分离
主从复制：往主服务里插入一条数据的同时，也往从服务里写入一条数据（备份、容灾）
读写分离：一般主作为写（20%），从作为读（80%）

3、在Memcached 高速缓存、MySQL主从复制，读写分离的基础之上，由于大量数据的增加，写压力开始出现瓶颈，由于MyISAM使用表锁，在高并发下会出现严重的锁问题，大量的高并发MySQL应用开始使用InnoDB引擎代替MyISAM。
同时开始使用分库分表来缓解压力。
MySQL的扩展性差（需要复杂的技术来实现），大数据下IO压力大，表结构更改困难，正是当前使用MySQL的开发人员面临的问题。

4、为什么用NoSQL?
今天我们可以通过第三方平台（如：Google,Facebook等）可以很容易的访问和抓取数据。用户的个人信息，社交网络，地理位置，用户生成的数据和用户操作日志已经成倍的增加。
我们如果要对这些用户数据进行挖掘，那SQL数据库已经不适合这些应用了, NoSQL数据库的发展也却能很好的处理这些大的数据。

二、什么是NoSQL?

NoSQL(NoSQL = Not Only SQL )，意即“不仅仅是SQL”，泛指非关系型的数据库。

1、作用
NoSQL数据库种类繁多，但是一个共同的特点都是去掉关系数据库的关系型特性。数据之间无关系，这样就非常容易扩展。也无形之间，在架构的层面上带来了可扩展的能力。
NoSQL数据库都具有非常高的读写性能，尤其在大数据量下，这得益于它的无关系性，数据库的结构简单。
NoSQL无需事先为要存储的数据建立字段，随时可以存储自定义的数据格式。而在关系数据库里，增删字段是一件非常麻烦的事情。如果是非常大数据量的表，增加字段简直就是一个噩梦。

2、关系型数据库（RDBMS）VS 非关系型数据库（NoSQL）
RDBMS：

高度组织化结构化数据
结构化查询语言（SQL）
数据和关系都存储在单独的表中。
数据操纵语言，数据定义语言
严格的一致性
基础事务

NoSQL：
代表着不仅仅是SQL
没有声明性查询语言
没有预定义的模式
键 - 值对存储，列存储，文档存储，图形数据库
最终一致性，而非ACID属性
非结构化和不可预知的数据
CAP定理
高性能，高可用性和可伸缩性

总结： RDBMS 和NoSQL都有各自的特点和使用的应用场景，让关系数据库关注在关系上，NoSQL关注在存储上。

三、互联网时代面临的问题

1、3V 和 3高
3V: 海量的数据流量；多样(商品种类、各式各样)；实时的数据需求
3高：高并发；高可用；高性能

四、NoSQL 数据模型简介
传统的关系型数据模型的设计基本上是基于数据库范式建立1：1 / 1：N / N:N,主外键的关系设计。
1、NoSQL的设计：
使用Bson() 类似于json的一种二进制形式的存储格式，简称 Binary JSON,它也同样支持内嵌的文档对象和数组对象。
2、聚合模型
高并发的操作是不太建议有关联查询的，互联网公司用冗余数据来避免关联查询，分布式事务是支持不了太多的并发的。
3、NoSQL数据库的四大分类：
①KV键值对：redis，内容缓存，主要用于处理大量数据的高访问负载等；
②bson：文档数据库，MongoDB 是一个基于分布式文件存储的数据库，C++编写的。皆在为web应用提供可扩展的高性能数据存储解决方案。它介于关系型数据库与非关系型数据库之间的产品，是非关系型中功能最丰富的，且最像关系型数据库的；
③列存储数据库：分布式文件系统
④图关系型数据库：它不是放图的，放的是关系：如朋友圈社交网络等。专注于关系图谱。

参考：互联网背景下为什么会出现NoSQL？ - CSDN博客
https://blog.csdn.net/u013709087/article/details/78313923

posted @ 2018-08-18 15:12 范仁义阅读(1894) 评论(0) 收藏举报

刷新页面返回顶部

范仁义

在校每年国奖、每年专业第一，加拿大留学，先后工作于华东师范大学和香港教育大学

为什么会出现NoSQL数据库

为什么会出现NoSQL数据库

一、总结

一句话总结：sql不支持分布式且且有性能瓶颈且不支持分布式，不同NoSQL适合不同的场景

1、"不同的NoSQL数据库只适合不同的场景"这句话对么？

2、NoSQL数据库有哪四种？

3、数据库主从复制和读写分离是什么？

二、互联网背景下为什么会出现NoSQL？

一、传统应用模式（ALL IN ONE）

二、什么是NoSQL?

三、互联网时代面临的问题

作者相关推荐

公告

范仁义

在校每年国奖、每年专业第一，加拿大留学，先后工作于华东师范大学和香港教育大学

为什么会出现NoSQL数据库

为什么会出现NoSQL数据库

一、总结

一句话总结：sql不支持分布式且且有性能瓶颈且不支持分布式，不同NoSQL适合不同的场景

1、"不同的NoSQL数据库只适合不同的场景"这句话对么？

2、NoSQL数据库有哪四种？

3、数据库主从复制和读写分离是什么？

二、互联网背景下为什么会出现NoSQL？

一、传统应用模式 （ALL IN ONE）

二、什么是NoSQL?

三、互联网时代面临的问题

公告

一、传统应用模式（ALL IN ONE）