<Information Storage and Management> 读书笔记 之二
1.2 存储技术也架构的进化
=========================
曾经, 组织机构在数据中心拥有集中的计算机和信息存储设备(磁带和磁盘组). 随着开放系统的进化, 以及这总进化带来的成本节约, 易于部署, 使得商业实体和部门拥有自己的服务器和存储成为可能. 在早些的开放式系统的视线中, 典型地, 存储是在服务器内部的.
企业内部门服务器的增多导致了无保护,无管理,成碎片的信息, 并增加了操作成本. 原来的时候, 管理这些信息和所创建出来的数据的政策和规程非常有限. 为了战胜这些挑战, 存储技术从非智能的内部存储进化为了只能的网络存储, 见图1-4. 这项技术的最重要的部分包括:
- 冗余独立磁盘阵列(Redundant Array of Independent Disks-RAID): 这项技术是为了达到节约成本, 提高使用数据性能和数据可用性的目的的. 到今天, 它仍在进化, 并且在所有的存储架构中都在使用, 比如说DAS, SAN, 等等.
- 直接挂载存储(Direct-attached storage - DAS): 这种类型的存储直接连接到服务器(宿主), 或者一个服务器集群(cluster)上. 存储既可以是服务器内部的, 也可以是服务器外部的. 外部的DAS缓和了内部存储容量限制的矛盾.
- 存储区域网络(Storage area network -SAN): 这是一种专门的高性能的纤维渠道(Fibre Channel-FC)网络, 用于帮助block-level的服务器与存储之间的通讯. 存储被分区后分配给服务器用于访问它的数据. 相对于DAS, SAN提供了可量测性, 可用性, 高性能和成本的优势.
- 网络挂载存储(Network-attached storage - NAS): 这是专门为文件服务应用程序所用的存储方式. 与SAN不同, 它通过连接到一个已经存在的通讯网络(LAN), 并为多种多样的客户端提供文件访问. 由于它是有目的的为文件服务器应用程序服务的, 它比通用的文件服务器提供了更高的可量测性, 可用性和成本优势.
- 因特网协议SAN( Internet Protocol SAN - IP-SAN): 这是存储架构最近的演化了, IP-SAN是一个在SAN和NAS技术的集合. IP-SAN跨越本地和更广低于的网络提供block-level的通讯, 结果是数据更加坚固和更强的可用性.
存储技术和体系结构持续地进化, 使得组织能合并, 保护, 优化数据, 并使用他们的数据来达到数据资产的最高回报.
1.3 数据中心基础设施
====================
组织机构用维护数据中心的方式来提供企业内集中的数据处理能力. 数据中心存储和管理大量非常关键的数据. 数据中心的基础设施包括计算机, 存储系统, 网络设备, 专门的后备能源, 和环境控制(包括空调和防火).
大型机构经常维护不止一个数据中心来讲数据处理的负载均分掉, 并且在灾难事件中提供备份. 存储中心对存储的需求是通过各种存储架构的组合来实现的.
1.3.1 核心元素
------------------
对于数据中心的功能有五个核心元素是必不可少的.
- 应用程序: 应用程序是为计算操作提供逻辑的计算机程序. 应用程序比方说订单处理系统, 可以在数据库层上, 它依次使用操作系统的服务来执行对存储设备的读写操作.
- 数据库: 更通常地, 数据库管理系统(DBMS)提供了一种结构化的方式用逻辑上以相互关联的表来组织的方式来存储数据. DBMS会对存储和读取数据进行优化.
- 服务器和操作系统: 即运行着应用程序和数据库的计算平台.
- 网络: 帮助在客户端,服务器之间, 或是服务器和存储之间通讯的数据路径.
- 存储阵列: 永久存储数据的设备.
这些核心元素典型地被当作分开的实体来看待和管理的, 但是所有的元素必须一起工作才能解决数据处理的需求.
图表1-5显示了一个订单处理系统的例子, 它涉及到了数据中心的5个核心元素, 并阐述了它们在商业处理中的功能.
1.3.2 数据中心元素的关键需求
------------------------
数据中心的无中断操作对于商业的生存和成功是非常重要的. 拥有任何时刻都可用的可靠的基础设施是必要的. 尽管图标1-6对数据中心架构都适用, 我们这里的着重讨论的是存储系统. 达成这些需求的各种技术和解决方案这本书中都会有覆盖.
- 可用性: 所有的数据中心元素都应该按照确保时刻可以访问这个特性来设计.
- 安全性: 用以阻止对信息未授权的访问的策略, 过程, 以及数据中心核心元素的恰当的整合都必须被建立起来. 除了对客户端访问以外,还需要确立个别的机制来确保服务器仅访问分配给他们的资源和存储阵列.
- 可扩展性: 数据中心操作应该可以依据需要分配额外的处理能力或存储能力, 而不影响商业操作. 业务增长市场需要部署更多的服务器, 新的应用程序, 和额外的数据库. 存储解决方案应该能够跟着业务一起增长.
- 高性能: 数据中心所有的核心元素都应该可以提供优化的性能, 为所有的请求提供高速的服务. 基础架构是应该能够满足高性能需求的.
- 数据完整性: 数据完整性指的是诸如纠错代码或奇偶校验机制, 从而可以确保写到磁盘上的数据跟收到的数据是完全一样的. 在获取数据期间的任何变化都意味着崩溃, 这对组织实体的操作会产生影响.
- 容量: 数据中心操作需要充分的资源来高效地存储和处理大量的数据. 当容量需求增加的时候, 数据中心必须能够提供额外的容量而不影响数据的访问, 或者, 至少至少, 最小的宕机时间. 容量可以通过对已有资源的重新分配来获得, 而不是添加新的资源.
- 可管理性: 数据中心应该以最搞笑的方式来执行所有的操作和行为. 可管理性可以通过自动化和减少普通工作的人工参与来达到.
摘译自<<Information Storage Management>>