数据库概览与选择

1 数据库市场介绍

DB-Engines 发布的2017 年 2月份的数据库排名前10的数据库如下，其中商业数据库4个，开源6个，关系型数据库7个，非关系型3个

2 如何选择数据库

A、看应用场景 — OLTP/OLAP

　　OLTP（联机事务处理）
　　事务性非常高的系统，一般都是高可用的在线系统，以小的事务以及小的查询为主，评估其系统的时候，一般看其每秒执行的Transaction以及Execute SQL的数量。
　　典型应用：电子商务系统、银行、证券等，如eBay的业务数据库，就是很典型的OLTP数据库

　　OLAP（联机分析处理）
　　有的时候也叫DSS决策支持系统，就是我们说的数据仓库。在这样的系统中，语句的执行量不是考核标准，因为一条语句的执行时间可能会非常长，读取的数据也非常多。所以，在这样的系统中，考核的标准往往是磁盘子系统的吞吐量（带宽），如能达到多少MB/s的流量。
　　典型应用：大数据分析。

B、看应用场景 — SQL / NoSQL

NoSQL与SQL的区别
　　优点：高并发读写、海量数据存储、高可扩展性、高可用性
　　缺点：缺乏事务一致性、缺乏读写实时性、不支持复杂查询

NoSQL数据库类型
　　Key-value:通常用hash table来实现
　　列式数据库：同一列数据存在一起
　　文档型数据库：Key-Value对应的键值对，Value为结构化数据产品：MongoDB
　　图结构数据库：以“图”为基本存储模型，产品：Neo4j，InfoGrid，InfiniteGraph

C、看数据模型

　　关系数据库
　　数据模型：各种关系
　　例子：Oracle、Mysql
　　优点：高性能、可扩展的OLTP，支持SQL，物化视图，支持事务，编程友好

　　网格数据库（支持网格的数据库）
　　数据模型：基于空间的架构
　　例子：GigaSpaces, Coherence
　　优点：适于事务处理的高性能和高扩展性

　　对象数据库
　　数据模型：对象
　　例子：Objectivity, Gemstone
　　优点：复杂对象模型，快速键值访问，键功能访问，以及图数据库的优点

　　文档数据库
　　数据模型：包含了key-value的文档集合 ,
　　面向文档数据库会将数据以文档的形式储存。每个文档都是自包含的数据单元，是一系列数据项的集合。
　　每个数据项都有一个名称与对应的值，值既可以是简单的数据类型，如字符串、数字和日期等；也可以是复杂的类型，如有序列表和关联对象。
　　数据存储的最小单位是文档，同一个表中存储的文档属性可以是不同的，数据可以使用XML、JSON或者JSONB等多种形式存储。

　　产品：MongoDB、CouchDB、RavenDB

　　有谁在使用：SAP （MongoDB）、Codecademy （MongoDB）、Foursquare （MongoDB）、NBC News （RavenDB）

　　1. 适用的场景
　　　　1）日志。企业环境下，每个应用程序都有不同的日志信息。Document-Oriented数据库并没有固定的模式，所以我们可以使用它储存不同的信息。
　　　　2）分析。鉴于它的弱模式结构，不改变模式下就可以储存不同的度量方法及添加新的度量。

　　2. 不适用场景
　　　　在不同的文档上添加事务。Document-Oriented数据库并不支持文档间的事务，如果对这方面有需求则不应该选用这个解决方案。

　　图数据库
　　数据模型：节点和关系，也可处理键值对
　　图形数据库是NoSQL数据库的一种类型，它应用图形理论存储实体之间的关系信息。
　　最常见的例子，就是社会网络中人与人之间的关系。关系型数据库用于存储关系型数据的效果并不好，
　　其查询复杂、缓慢、超出预期，而图形数据库的独特设计恰恰弥补了这个缺陷。

　　产品：Neo4J、Infinite Graph、OrientDB

　　有谁在使用：Adobe （Neo4J）、Cisco （Neo4J）、T-Mobile （Neo4J）、Twitter（FlockDB）、美国国防部和中情局（InfiniteGraph）

　　1. 适用的场景
　　　　1）在一些关系性强的数据中
　　　　2）推荐引擎。如果我们将数据以图的形式表现，那么将会非常有益于推荐的制定

　　2. 不适用场景
　　　　不适合的数据模型。图数据库的适用范围很小，因为很少有操作涉及到整个图。

　　Key-Value数据库
　　数据模型：键值对
　　键值数据库就像在传统语言中使用的哈希表。你可以通过key来添加、查询或者删除数据，鉴于使用主键访问，所以会获得不错的性能及扩展性。

　　产品：Riak、Redis、Memcached、Amazon’s Dynamo、Project Voldemort

　　有谁在使用：GitHub （Riak）、BestBuy （Riak）、Twitter （Redis和Memcached）、StackOverFlow （Redis）、 Instagram （Redis）、Youtube （Memcached）、Wikipedia（Memcached）

　　1. 适用的场景
　　　　储存用户信息，比如会话、配置文件、参数、购物车等等。这些信息一般都和ID（键）挂钩，这种情景下键值数据库是个很好的选择。

　　2. 不适用场景
　　　　1）取代通过键查询，而是通过值来查询。Key-Value数据库中根本没有通过值查询的途径。
　　　　2）需要储存数据之间的关系。在Key-Value数据库中不能通过两个或以上的键来关联数据。
　　　　3）事务的支持。在Key-Value数据库中故障产生时不可以进行回滚。

　　BigTable类型数据库(列式数据库)
　　数据模型：列簇，每一行在理论上都是不同的
　　列存储数据库将数据储存在列族（column family）中，一个列族存储经常被一起查询的相关数据。举个例子，如果我们有一个Person类，
　　我们通常会一起查询他们的姓名和年龄而不是薪资。这种情况下，姓名和年龄就会被放入一个列族中，而薪资则在另一个列族中。

　　产品：Cassandra、Hbase

　　有谁在使用：Ebay （Cassandra）、Instagram （Cassandra）、NASA （Cassandra）、Twitter （Cassandra and HBase）、Facebook （HBase）、Yahoo!（HBase）

　　1. 适用的场景
　　　　1）日志。因为我们可以将数据储存在不同的列中，每个应用程序可以将信息写入自己的列族中。
　　　　2）博客平台。我们储存每个信息到不同的列族中。举个例子，标签可以储存在一个，类别可以在一个，而文章则在另一个。

　　2. 不适用场景
　　　　1）如果我们需要ACID事务。Vassandra就不支持事务。
　　　　2）原型设计。如果我们分析Cassandra的数据结构，我们就会发现结构是基于我们期望的数据查询方式而定。
　　在模型设计之初，我们根本不可能去预测它的查询方式，而一旦查询方式改变，我们就必须重新设计列族。

D、看成本（商业 VS 开源）

商业数据库：付费使用，功能更强大一点，支持好，维护成本相对低一点
开源数据库：免费使用，功能有所牺牲，维护支持的成本相对高一点

数据库参数对比

3 常见的数据库

A、Oracle

　　基本情况：Oracle前身叫SDL，由Larry Ellison和另两个编程人员在1977年创办，Oracle公司是最早开发关系型数据库的厂商之一，目前是数据库市场占有率第一的厂商。
　　优点：牛逼公司的牛逼产品，几十年技术积累，可靠、安全、性能高 ……
　　缺点：对硬件的要求很高，价格比较昂贵，管理维护麻烦，操作复杂，需要技术含量较高
　　适用场景：各行各业都有应用，全球500强中有三分之二的企业使用Oracle

B、Mysql

　　基本情况：开源、传统关系型数据库、快速的、多线程、多用户和健壮的SQL数据库服务器，瑞典的MYSQL AB公司开发，2008年被Sun公司收购，2010年Oracle公司以74亿美元收购了Sun公司
　　特点：优秀的开源产品，成熟，门槛低，有丰富的资料可以查阅，体积小，开放源码，可运行在Windows平台和大多数的Linux平台上，快速，轻量级，易于扩展，免费，跨平台
　　适用场景：广泛的应用在Internet上的中小型网站中
LAMP（Linux+Apache+Mysql+Php）

C、Microsoft SQL Server

　　基本情况：微软开发的大型关系型数据库，1987年，微软与IBM合作开发完成OS/2，IBM在其销售的OS/2 Extended Edition系统中绑定了OS/2 Database Manager,而微软产品线尚缺数据库产品，于是，微软将目光投向Sybase，同Sybase签订了合作协议，使用Sybase技术开发基于OS/2系统的关系型数据库，1989年年，微软发不了SQL Server 1.0版。后来，微软与Sybase分道扬镳后，在其6.05和7.0版本中重写了核心数据库系统。
　　优点：牛逼公司的产品，安全性和可用性高，性能快……
　　缺点：只能在微软的Windows平台运行，开放性差……
　　适用场景：主机操作系统为Windows，主要用于web网站的建设，承载中小型web后台数据

D、MongoDB

　　基本情况：MongoDB是一个介于关系数据库和非关系数据库之间的产品，是非关系数据库当中功能最丰富，最像关系数据库的。2007年10月，MongoDB由10gen团队发展，2009年首度推出；2012年5月，MongoDB 2.1开发分支发布，该版本采用了全新架构；目前，已经发展到3.4版了。
　　优点：NoSQL数据库的优点，高扩展性等…
　　缺点：NoSQL数据库的缺点，不支持复杂查询
　　适用场景：适合存大尺寸、低价值的数据，高伸缩性的场景，不适合高度事务性的系统，如银行或会计系统等

E、Redis

　　基本情况：2008年，意大利一家创业公司Merzia推出一款基于MySQL的网站实时统计系统LLOOGG，然而产品上线没多久，该公司的创始人Salvatore Sanfilippo就对MySQL的性能非常不满意，于是亲自操刀开发一款为LLOOGG量身定制的数据库，也就是Redis的雏形。LLOOGG.com是一个访客信息追踪网站，网站可以通过 JavaScript 脚本，将访客的 IP 地址，所属国家，浏览器信息，被访问页面的地址等数据传送给LLOOGG.com。然后LLOOGG.com会将这些浏览数据通过web页面实时地展示给用户，并储存起最新的5至10000条浏览记录以便进行查阅。如下图所示：

随着LLOOGG.com的用户越来越多，LLOOGG为每个网站维护的浏览记录列表变得越来越多，执行的插入和弹出操作也越来越多，由于当时使用的数据库是MySQL，过度频繁的磁盘I/O操作严重影响着系统的性能，这使得Salvatore Sanfilippo萌生出开发一款列表结构的内存型数据库的想法。
　　优点：高速读写，拥有非常丰富的数据结构，且这些数据结构的常见操作均是原子性的
　　缺点：耗内存，持久化
　　适用场景：常用作缓存，配合其他数据库一起使用

posted @ 2017-03-21 20:00 我是疯子杨阅读(622) 评论(0) 收藏举报

刷新页面返回顶部

我是疯子杨

数据库概览与选择

1 数据库市场介绍

2 如何选择数据库

3 常见的数据库

公告