常见数据库介绍和使用场景

在构建系统时要进行设计考虑和权衡。

1.介绍

要选择正确的存储解决方案，需要以下考虑。

关键因素

数据结构
查询模式
您需要处理的数量或规模

2.缓存解决方案

如果您经常调用数据库或远程调用具有高延迟的独立服务，则可能需要[缓存]（https://interviewdaemon.com/courses/design-concepts-a-to-z/lessons / caching /）您本地的一些数据。
一些关键值缓存存储解决方案是Memcached，Hazelcast，Redis等
大多数使用Redis，Memcache和Elasticache。

3.文件存储解决方案

文件存储用作图像，视频等的数据存储。
数据库旨在存储可以查询的信息，而您不需要查询的文件，只需按原样提供它们即可。这是当我们使用称为Blob存储的东西时。
Amazon S3主要用于Blob存储

4.CDN

通常，blob存储与[内容交付网络]（https://interviewdaemon.com/courses/design-concepts-a-to-z/lessons/content-distribution-network-cdn/）或[CDN]（https://interviewdaemon.com/courses/design-concepts-a-to-z/lessons/content-distribution-network-cdn/）。
CDN是遍布全球的服务器网络，可在不同地理位置提供内容并减少延迟。
如果您要从中获取内容的服务器离您的地理位置更近，则将以更快的方式将内容传递给您。

5.文本搜索功能

5.1.文本搜索

假设您要构建搜索功能，用户可以在其中按电影，流派，演员，女演员，导演等进行搜索。
在这里，您可以使用诸如Solr之类的搜索引擎
它建立在Apache Lucene之上

5.2.模糊搜索

如果您在搜索中搜索拼写错误/不正确的单词，并且搜索结果中包含正确的单词结果，则称为模糊搜索。
搜索引擎存储临时数据或索引数据，并且不保证长期数据，因此搜索存储不用作主存储。
例如，如果我们输入“ intraviw”，它将根据“面试”进行搜索
我们可以从主数据库中将数据加载到它们，以减少搜索延迟并提供基于模糊和相关性的文本搜索。
可以支持模糊搜索的Elasticsearch。
它也是基于Apache Lucene构建的

6.时间系列数据库

假设我们正在尝试建立度量跟踪系统，或者在任何基于时间的数据库中我们都需要一个时间序列数据库。
与标准关系数据库不同，时间序列数据库永远不会被随机更新。
大部分会依序追加。
相对于随机读取，在特定时间范围内会有更多的批量读取。在过去1周，10天，1个月，1年等时间内，有多少人观看了编解码器视频。
时间序列数据库的一些示例是OpenTSDB，InfluxDB等。
我们还可以使用任何非关系时间序列数据库。

7.分析和数据仓库

我们需要一个大型数据库来转储可供我们使用的所有数据，以执行分析。
主要用于离线报告，而非事务性
存储所有数据，以便他们可以执行分析。
HDFS通常用于存储海量数据
Hadoop和Spark是非常常用的数据仓库和处理。

8.SQL与NoSQL

8.1.SQL

结构取决于我们用来确定将使用哪种类型的因素
如果您需要[ACID]（https://interviewdaemon.com/courses/design-concepts-a-to-z/lessons/acid-vs-base-property/）属性，则需要使用关系DBMS。
一些示例是MySQL，Oracle，Postgres等
付款系统主要需要交易和原子性。
[强一致性]（https://interviewdaemon.com/courses/design-concepts-a-to-z/lessons/database-consistency/）主要可以通过SQL数据库来实现。

8.2.NoSQL

假设您正在尝试为诸如Amazon之类的商品建立目录，您想在其中存储有关具有各种属性的不同产品的信息。
例如，不同产品的这些属性通常不同。药品将有有效期，但冰箱将具有能量等级。
在这种情况下，我们的数据不能表示为表格。这意味着我们需要使用NoSQL数据库。
如果您需要[BASE]（https://interviewdaemon.com/courses/design-concepts-a-to-z/lessons/acid-vs-base-property/）属性，则可以使用非关系数据库前进。
对于[最终一致性]（https://interviewdaemon.com/courses/design-concepts-a-to-z/lessons/database-consistency/），我们可以使用NoSQL数据库
最常见的NoSQL DB是MongoDB，Cassandra，DynamoDB

8.2.1.基于文档（基于查询的数据）

如果我们拥有大量数据-不仅是数量，而且还有各种各样的属性-并且我们需要运行各种各样的查询，则需要使用一种称为Document DB的东西。
使用文档数据库，随机查询或其他查询最有效
Couchbase或MongoDB是一些常用的文档数据库

8.2.2.图形存储

这些类型的数据库使数据可视化更加容易。
它们非常善于在节点的帮助下存储不同数据点之间的关系。
图形存储可能不是最可扩展的数据库。
但是，它们在防止欺诈等使用案例方面效率很高。
图形数据库的常见示例是Neo4j 和 JanusGraph。

8.2.3.Key-value 存储

这些都是非常简单的数据库管理系统，存储关键值对。
最终目标是快速获取基本数据。
这些类型的数据库的常见用例是排行榜和购物车数据。
redis是流行的key value 存储。

8.2.4.柱状数据库（不断增加的数据）

有限的查询种类，但是数据库的大小持续快速增加。例如订单，目录
现在，Uber司机的数量将逐日增加，即每天收集的数据也会逐日增加。这成为越来越多的数据。
在这种情况下，我们使用诸如Cassandra或HBase之类的列式数据库。

9.不同数据库的组合

示例：Amazon.com

对于一个我们只有一件库存产品，但有多个用户试图购买它的产品，它应该只卖给一个用户，这意味着我们在这里需要ACID。因此，一个明显的选择应该是像MySQL这样的关系数据库。
与亚马逊产品相关的数据将会不断增加，并且会有各种各样的属性。我们应该使用像Cassandra这样的Columnar NoSQL数据库。。
我们可以在MySQL数据库中存储尚未交付的订单数据，一旦订单完成，我们可以将其移到Cassandra永久存储。。
用于报告系统有多少人购买了一个特定的项目。因此，报告不能针对单个产品，而应该针对产品的子集，这些产品可以在Cassandra或MySQL中。这样的需求就是我们最好的选择是像Mongo DB这样的文档DB的一个例子。
假设您想要查看上个月有多少人买了糖，您可以从Mongo DB获取订单id，并使用此订单id从Cassandra或MySQL获取其余数据。

资料来源：https://www.codekarle.com/system-design/Database-system-design.html
https://towardsdatascience.com/choosing-the-right-database-in-a-system-design-interview-b8af9c6dc525

posted @ 2021-05-12 09:21 程序员石磊阅读(2335) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

编辑推荐：
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语，封装的思维：从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热？
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 使用C#创建一个MCP客户端
· ollama系列1：轻松3步本地部署deepseek，普通电脑可用
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· 按钮权限的设计及实现

公告

程序员石磊的技术公众号

lovepythoncn

昵称：程序员石磊
园龄： 6年
粉丝： 5
关注： 2

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

文章分类

平日积累(1)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:echarts gl 3d地图，click事件失效，解决办法
会报错哎疯了疯了真是太难了
--老坛拌饭
2. Re:echarts gl 3d地图，click事件失效，解决办法
请问vue怎么弄呢= =。
--老坛拌饭
3. Re:activiti创建自子任务，创建抄送任务，任务分裂的实现思路
没有
--程序员石磊
4. Re:activiti创建自子任务，创建抄送任务，任务分裂的实现思路
“注意，新建的task不影响主流程的推进，就是父任务结束了流程也会向后面流转，子任务也不会结束”
想多了吧，这种方式创建的task会直接存入his表
--没赶上班车
5. Re:echarts gl 3d地图，click事件失效，解决办法
试试这个版本
--有理想的coder