目录 |
存储区域网络是一种面向网络的存储结构,是以数据存储为中心的。SAN采用可扩展的网络拓扑结构连接服务器和存储设备,并将数据的存储和管理集中在相对独立的专用网络中,面向服务器提供数据存储服务。服务器和存储设备之间的多路、可选择的数据交换消除了以往存储结构在可扩展性和数据共享方面的局限性。
通过协议映射,SAN中存储设备的磁盘或磁带表现为服务器节点上的“网络磁盘”。在服务器操作系统看来,这些网络盘与本地盘一样,服务器节点就像操作本地SCSI硬盘一样对其发送SCSI命令。SCSI命令通过FCP、iSCSI、SEP等协议的封装后,由服务器发送到SAN网络,然后由存储设备接收并执行。服务器节点可以对“网络磁盘”进行各种块操作,包括FDISK、FORMAT等,也可以进行文件操作,如复制文件、创建目录等。
采用SAN的存储解决方案的优点有以下几个方面。
1.解决了存储网络和应用网络争用网络带宽的问题。通过将所有的存储设备单独构建一个存储网络,实现服务器通过SAN访问数据,而客户端不能直接访问存储设备。
2.提高了存储性能。由于SAN采用了光纤通道技术,所以它具有更高的存储带宽。SAN的光纤通道使用全双工串行通信原理传输数据,传输速率高达100Mbit/s,并且支持200Mbit/s的光纤通道交换机也已经出现。
3.平滑增加存储容量。在SAN环境下,存储设备可以动态加到磁盘池内,并且根据需要随时分配给与SAN相连的服务器。
4.数据移动解决方案。SAN的出现使不使用服务器(ServerFree)和不使用网络(LANFree)的数据拷贝成为可能,减轻了服务器的处理负担和对网络带宽的争用。
5.备份和恢复解决方案。传统的本地备份和恢复成本高、设备利用率低、管理复杂,网络备份和恢复是一种高性价比的方法,但是要占用大量的网络带宽。SAN将一到多台磁带设备分配给每个服务器,使用光纤通道协议将数据直接从磁盘设备传递给磁带设备。
6.容灾和恢复。使用SAN基础结构,可以实现远程的容灾和恢复。当需要更长距离的备份时,SAN可以使用网关和WAN进行连接,因此SAN也适合于复杂网络应用。
SAN在很大程度上满足了存储系统在可用性和伸缩性方面的需求,但传统的SAN受限于现有的光纤传输方式,价格昂贵,而且缺少远距离的支持。同时,SAN方案不是采用传统的IP技术,所以一般管理员并不熟悉,需要进行有专门的培训,因此增加了相应的运行维护成本。
DAS、NAS、SAN3种存储方式目前基本满足了企业信息系统在单服务器扩容、服务器双机高可用性集群以及网络文件共享等的需求。同时,NAS和SAN逐渐成为企业首选的存储解决方案。3种存储方式的比较如图所示。
从图中可以看出,在DAS方式下应用系统、文件系统和磁盘存储系统之间的连接是直接进行的;在NAS方式下磁盘存储和文件系统是在一起的,然后通过网络与应用系统连接;而SAN方式则把磁盘存储系统独立出来,通过网络将它与应用程序和文件系统相连接。
FC SAN存在互操作性问题,尽管不同厂商都采用光纤通道协议,但协议的具体实现在各个厂商之间有所不同,因而各个厂商的设备之间的互操作性问题不能得到很好地解决。同时,FC光纤通道理论上最长的传输距离为10km左右,虽然较本地连接中的传统以太网扩展了很多,但在互联网存储应用中仍会形成信息孤岛。为了提高SAN的应用范围,充分利用SAN本身所具有的架构优势,许多存储和网络设备商开始考虑摒弃“陌生”的FC。与此同时,在基于IP的互联协议取得了巨大成功的背景下,人们开始考虑在熟悉的、廉价的IP网络上构建SAN。这就导致了“Storage over IP”(简称“SoIP”)即IP存储的诞生。
SAN的最初目标,是将备份流量从局域网的网络流量中分离出来,并且为多台计算机提供对备份磁带库和集中化的数据存储的共享访问。在局域网的初期,局域网上产生和传输的数据量并不是一个显著的问题。用户产生的所有数据可以保存到局域网服务器的磁盘驱动器上并备份到软盘上。在早期,随着数据量的膨胀,可以将额外的驱动器添加到服务器中以进行数据存储,磁带备份设备也可以直接连接到服务器上或者直接将磁带备份设备连接到局域网以提供足够的备份容量,并且对局域网或服务器的性能不会带来很大的影响。即便随着数据量和数据流量的持续增加,这些备份设备也可以整晚运行以防止白天对网络造成阻塞,而且能够在正常的业务时间内确保为用户提供足够的网络性能。
随着组织机构开始实施能够保存几百GB甚至TB级有价值数据的大型数据库服务器时,所有的情况都发生了改变。如今,备份操作再也不能在夜间完成。结果会导致备份操作必须整天持续不断地运行,这样就对网络性能造成了显著的影响。
SAN的引入,减轻了局域网中由于进行数据备份而引起额外的网络流量所带来的性能损失。采用SAN,数据备份和数据存储可以从局域网上移开,同时仍然提供集中式数据应用并且为局域网上的用户提供数据的共享式访问。
采用SAN的许多当前原因来自于要求数据在所有的时间内,每周7天,每天24小时,并且全年365天都可用,甚至不允许有一刻停机的需求。将数据的不可用归结于硬件失效是不可接受的,并且在数据不可用的情况下而继续组织机构的运转也是无法想象的。由于这些标准,提供SAN解决方案的公司引入了软硬件来提供高可用性、灾难恢复以及业务的持续运行。
高可用性(HA,High Availability)意味着即使硬件或软件失效时,数据也总是可用。通常,HA包含多个存储设备,每个存储设备都有组织机构的一份数据副本。如果保存某份副本的硬件失效了,则另一存储设备是立刻可用的。另外,通常将多个服务器配置成共同进行数据访问。如果一台服务器失效了,则另一服务器即刻可用以完成数据请求。
灾难恢复是将数据从灾难性丢失中进行恢复的过程。这个过程包括将数据备份到SAN上的高端磁带库中,在远离工作场所的地点保存多份数据副本。这些远离工作场所的数据存储的地点,通常由负责运行和维护数据的另一组织机构指定。现代SAN能够满足将数据传输至磁带库上,而且高速的电信服务使得SAN之间的数据传输和复制成为一种有效的灾难恢复机制。在灾难性数据丢失事件中,数据既可以从保存在远离工作场所的数据存储设施(即磁带)上得到还原,也可以通过高速载波线路将数据还原到首要工作地点。
业务的持续运行是现代SAN支持的另一种数据可用性策略(同时它也是一个时髦用语)。一个位置的SAN同另一位置的SAN通过高速载波服务连接在一起,数据就可以持续地复制到远端的SAN上。如果有灾难性的数据丢失,比如说,第一工作地点的物理结构受损,但业务操作仍可以立即传输至远端。业务的持续运行是可能的,因为在远端维护了一份所有数据的相同副本。
抛开历史的和当前的原因,所有这些SAN的数据存储和数据可用性策略,只有通过不断发展的SCSI协议才有可能。
SAN主要面向企业级存储。当前企业存储方案所遇到的问题是:数据与应用系统紧密结合所产生的结构性限制,以及目前小型计算机系统接N(scsr)标准的限制。SAN之所以被认为是适合企业级存储的方案,是由于SAN便于集成,并且能够改善数据可用性及网络性能,而且还可以减轻管理作业。
SAN主要用于存储量大的工作环境,如ISP、银行等,但现在由于需求量不大、成本高、标准尚未确定等问题影响了SAN的市场,不过,随着这些用户业务量的增大,SAN也有着广泛的应用前景。
SAN解决方案的优点包括:
(1)SAN提供了一种与现有LAN连接的简易方法,并且通过统一物理通道支持广泛使用的SCSI和IP协议。SAN不受现今主流的、基于SCSI存储结构的布局限制。特别重要的是,随着存储容量的爆炸性增长,SAN允许企业独立地增加它们的存储容量。
(2)SAN的结构允许任何服务器连接到任何存储阵列,这样不管数据放置在哪里,服务器都可直接存储所需的数据。
因为采用了光纤接口,SAN还具有更高的带宽。因为SAN解决方案是从基本功能剥离出存储功能的,所以运行备份操作就无需考虑他们对网络总体性能的影响。SAN方案也使得管理及集中控制实现简化,特别是对于全部存储设备都集群在一起的时候。最后一点,光纤接口提供了10km的连接长度,这使得实现物理上分离的、不在机房的存储变得非常容易。
要在企业环境中成功实施SAN的应用,基本建设至关重要。此处根据业务的数据特征,展示一个典型的成功案例。通过关键技术的实现,来了解如何构建SAN存储环境。
对数据安全性、存储性能、在线连接性和文件系统级的灵活性要求高,并对分散数据需要备份,又具有超大型海量存储。
某大型企业通信部门主要从事接收、处理、存档和分发各类全球性卫星数据,以及卫星接收技术和数据处理方法的研究。卫星的观测信息以图形方式显示,通过地面接收转换成数字格式保存,但每条信息所占用的存储空间都很大,每天的数据量在几百MB到2GB之问。由于在线数据存储空间有限,特别是用户要通过HDDT磁带方式对数据进行存档管理,并需要以人工方式管理磁带,从而使得数据查找效率低下,大量珍贵数据得不到有效利用。
由于在线数据存储量大约在1~2TB,并在包括Sun、SGI、IBM的小型机和PC服务器在内的主机环境中还要增加曙光超级计算机,而且多台主机不仅集中存储,还要能够共享数据。另外,卫星下载资料以文件格式保存,单个文件可达GB级。针对这些需求,进行方案设计时首要考虑的因素是设备的容量和性能,以及系统的在线连接性和数据的共享。在此基础之上,还要扩大在线系统容量,建立自动化的数据备份系统,实现离线存储数据的自动管理。
如前所述,原环境中已存在一些网络设备,在构建SAN时增加一台光纤通道交换机和一台光纤通道磁盘阵列。由于用户的应用需要不同平台的多台主机共享数据,因此还要配备文件共享软件和网络文件系统转换的软件。本方案采用HDS公司的Thunder9200和IBM公司的光纤交换机2109—S08或S16组建存储区域网络,其拓扑结构如下图所示。
由于同一文件要被多台主机编辑、处理与访问,而且文件非常大,无论在SAN还是在LAN上传输都很浪费资源,因此要采取文件共享的方式,让所有主机访问文件的同一个拷贝。在多主机混合平台的情况下,采用IBM Tivoli SANergy软件,配以支持在Windows NT上实现NFS共享的软件NFS Maestro。
在此方案成功实施运转一个时期后,由于业务发展迅猛,系统的数据量快速增长,用户又提出增加在线存储容量和建立自动数据备份系统的需求。事实上,富有经验的集成商在系统设计初期已考虑到未来的扩展问题,当需要增加在线容量时,用户只需购买一台新的HDS Thunder 9200,将其连接到SAN上,它提供的存储空间即可分配给SAN上的任意主机,还能集中管理数据。当用户需要做自动数据备份时,根据对容量和备份窗口的要求来选择IBMSAN解决方案中的自动磁带库(如LTO系列),将其与备份服务器连接到SAN上,即可进行集中,且自动进行数据备份。扩容后的存储区域网拓扑结构如下图所示。当设备数量增加较多时,可以通过交换机堆叠或级联来增加SAN的连接能力。
该方案在性能、可靠性、扩展性和功能上满足了以下要求: