深入浅出谈存储之NAS是什么
NAS是Network-Attached Storage的简称。中文一般称为“网络附加存储”,或者“网络连接存储”。但是再爱国的业内人士也不喜欢叫这个中文名,就像乡下阿伯也不喜欢把NBA叫做“国家篮球联盟”一样。我们可以顾名思义的把NAS理解成通过网络提供存储的设备。比如你在装了Linux的电脑上共享一个目录,让其他Linux客户能够通过NFS协议访问该目录,那这台电脑就是一定意义上的NAS。如果你在这台电脑上装些软件,让Windows用户(通过CIFS)和Linux用户(通过NFS)都能访问这台电脑上的共享目录,那这台电脑就成了完全意义的NAS。一般NAS支持CIFS和NFS等协议,有些甚至支持FTP,但不是必须。下图展示了NAS在企业环境中扮演的角色。如果你不熟悉这些协议也不必担心,我们会在以后的文章中讲到。
当然,上文提到的这台NAS肯定卖不出去的。大多数企业之所以选择EMC和NetApp等公司的NAS,是因为它们有着一般文件服务器难以实现的功能。先简单的介绍一点,姑娘们请擦亮眼睛,看看和一般IT男捣鼓的东西差别有多大。
一.高性能。如果把一般文件服务器的性能比作一辆自行车,那NAS就是一辆宝马,不但负载能力强,速度也快(这个比喻是不是太俗了?)。这主要依靠多个层面的优化得到的:
1. NAS的操作系统经过高度定制,去掉了不必要的功能,完全为文件传输服务,在操作系统的层面提高了性能。这就像运动员都要轻装上阵一样的道理。EMC Celerra的DART和NetApp的ONTAP就是知名的NAS操作系统。
2. NAS支持LACP等链路聚合协议,提高了网络带宽。数据从网络进入NAS,如百川归海。如果把几条河并在一起,流量就大了。
3. NAS后端可以采用高性能的SAN。SAN通过cache和RAID等机制提高了性能。RAID 0 等技术能够通过stripe(条带)实现并发读写。并发读写的优势可以通过一个类比来帮助理解:比如现在有一批档案需要录入到电脑上,经理一个人打字需要做5天。分给5位员工一起做,一天就可以做完了。
4. NAS能对后端提供的逻辑卷(比如CLARiiON上的LUN)再做一次stripe,在高负载情况下保持高性能。比如有5批档案需要录入到电脑上,总经理可以平分给5位经理(相当逻辑卷的条带),5位经理再分给5位员工(相当RAID的条带)。
二.避免单点故障(single point of failure),实现高稳定性:
1. NAS的机头有一个随时待命的替补(standby),一旦机头跑着跑着受伤了,替补可以自动补上。
2. 在一条网络链路出现问题的时候,同一个Channel Group的其他链路还能继续传数据。
3. NAS机头到SAN的链路也有多条,一条发生故障,可以通过另一条访问。
4. RAID和hotspare技术尽量避免了硬盘损坏而导致数据丢失。
三.快照和备份技术,保证了数据的安全:
1. 很多NAS产品都支持快照技术,对文件系统定时拍快照,在不占用大量空间的前提下支持数据的快速恢复。比如EMC Celerra的Snapsure和NetApp Filer的Snapshot。
2. 对NDMP协议的支持,使NAS的数据备份和还原更快速,方便,且不占用网络资源。
四.支持数据的归档和重复数据删除,节省了费用:
1.长期没有使用的文件,可以归档到较低端的存储上,把更快更稳定的NAS存储空间让给热门数据,这个过程对客户端是透明的。Celerra的FileMover API和NetApp的Fpolicy都支持此功能。
2.张三同志存在“/摄影技术/陈老师专题”和李四同志存在“/先进性学习/活动采风”里的几百兆图片是一样的,但互相都不知道。NAS保存两份相同数据不是浪费了空间了吗?重复数据删除(deduplication)技术对相同内容的多个文件只保留一份内容。既节省了空间,又对用户透明。
以上介绍的,仅是NAS的冰山一角。接下来再分专题详解。写到这里,觉得有点枯燥。下笔前明明想写得轻松明快的,怎么一不小心就用到这么多专业名词?看来大侠们把文档写得那么晦涩也是有苦衷的。
说点题外话