信息生命周期管理(Information Lifecycle Management,ILM)
目录 |
由于EMC不断努力的推广和应用,信息生命周期管理(Information Lifecycle Management,ILM)正逐渐走俏,其实这个概念在上一世纪60-70年代,就已经诞生,之所以现在又得到宠爱,是和企业的信息化应用和互联网的高速发展分不开的。
企业的经理们在他们公司成堆的信息中,希望能够建立整合的信息流并加以利用为企业找到削减成本增加利润的途径的时候,不可避免地会碰到许多障碍。在这些挑战之中:
信息的爆炸性增长
“今天一个现代人一天所吸收的信息,比莎士比亚一生所得的信息还要多”,相信这种说法在今天已经被越来越多的人所认同。据统计,每年的全球数据增长量超过50%,而且这种增长的速度还在加快。对于企业来说更是如此,许多业务信息大多数可以在网上找到,这对公司的基础设施的建设需求带来了巨大的增长。随着信息技术引入企业商务实践,信息量正在大幅增长。而数据的存储格式却五花八门,难以统一。电子邮件信息、Word等文本类文档属于非结构化信息,数据库和业务交易等数据又属于结构化信息。然而要把这些不同的来源数据信息进行整合是一项非常复杂的系统工作。另一方面,信息的相关程度却不断提高。人们显然更关注的是信息之间的关联关系。而且,电子数据的增长也带来了一套全新的属性数据。属性数据是指关于数据的本身的信息(也是数据),譬如文件是由谁创建的、谁接触过它、修改过它以及它存放在何处等等内容。这种增长是呈指数性增长的趋势,从而对管理提出了重大的挑战。
成本的限制
企业必须面对日益激烈的竞争和要求不断缩减开支的经营环境。在这样的环境下,增长的信息系统基础设施建设工作将变得更加困难。在预算可能持平或略有上升的情况下,CIO们承担着用好每一分钱,发挥最大效益的工作压力。控制数据信息成本的能力至关重要,如果CIO们仅仅只是做扩张计划,那么就有可能导致信息系统产生冗余和重复,而这是企业所不希望看到的。
信息的战略价值
成本费用的压缩和企业规划的要求都无法阻止对于更方便的信息存取的需求。企业已经认识到信息对于企业来说,具有不可否认的战略价值,正不断寻求一种信息之间能够紧密结合、企业知识提取迅速快捷的解决方案。利润就来自于那些关键业务信息的易获得性、快速传递以及对它们的安全保护。
理解和认识信息的商业价值是知识管理的核心问题,它不仅需要企业的信息管理者具有高瞻远瞩的战略眼光,还需要企业整体业务团队的通力合作。
信息的流动性
信息在它存在的生命周期中的不同阶段,具有不同的商业价值,需要与之匹配的管理手段和方法。这意谓着企业需要创建相关的流程来允许信息根据需要自由地流动。信息在流动的过程中,价值并不总是越来越小,而企业制度才是决定一项业务数据信息流向的主要因素,企业需要建立起一种更加高效的数据移植能力,使得需要相关信息的人员可以更快地获取它们。
法律和法规的要求
随着信息化的普遍应用,企业各方面的信息都开始进入电子化。由于企业信息,特别是财务信息等重要信息,国家都有法规要求。一些国家的重点行业,如金融,电信和政府部门等,对信息的安全和可靠性更是有专门的规定,这都是和百姓的生活息息相关的。尤其考虑到中国人口众多,每个人的资料信息量加起来就更大,这些都需要高效的信息管理。
信息的灾难性恢复
不可抗力的情况发生,会对信息造成无法挽回的损失,譬如2003年的美加地区的大面积停电,如果企业重要的业务数据丢失,那么对企业造成的损失就不仅仅是数据本身,还有商业机会可能丧失,客户服务水平也会下降。从小的方面说,个别硬件系统的意外和不稳定同样会对企业重要信息的造成破坏,给企业造成难以觅补的损失。
从以上几点可以看出,企业正越来越需要对信息进行更加有效安全的管理模式。
什么是ILM?ILM(Information Lifecycle Management),根据META集团的定义,信息(或数据)生命周期管理是,信息在储存媒介网络之内流动的过程,而这种过程需要确保企业获取需要的商业信息,并向客户提供一个良好的服务水平,同时把单位成本降到最低。ILM还要满足日益增长的对于成熟和自动化存储管理的需求,这可以在保持企业对于商业环境变化作出快速反应的能力的同时,提高个人的工作效率。这一种定义强调的是过程的概念。
ILM的积极推行者EMC公司将ILM定义为主动预防性的信息管理方法,帮助企业以最低的总体拥有成本,在信息生命周期的每一阶段都能获得信息的最大价值。
从这些定义可以看出,ILM不是一个具体的产品,而是一个管理理念,更强调从企业级别的视角,对信息进行更有效的管理、更有价值的开发和利用的全过程。
信息生命周期管理作为一种信息管理模型,认为信息有一个从产生、保护、读取、更改、迁移、存档、回收的周期、再次激活以及退出的生命周期,对信息进行贯穿其整个生命的管理需要相应的策略和技术实现手段。信息生命周期管理的目的在于帮助企业在信息生命周期的各个阶段以最低的成本获得最大的价值。
看看企业中的信息是如何流动的。
一笔业务信息从客户订单下达开始,就诞生了,此时的信息拥有的价值较高,许多相关部门的人员都要对信息进行存取和处理,当一个订单完成以后,该笔信息的价值开始逐渐下降,此时将它转存到低成本的存储介质中可以节约成本。而当该笔业务发生后续服务问题,譬如质量,咨询和改进等等,此时企业又需要该条信息的内容,把它重新激活,提取到高效设备中。随着质量保证期期满,这一信息的价值又重新下降,直到一定期间以后,退出它的生命周期。
除了关注信息在其生命周期各阶段中的不同价值,信息本身的内容同样十分重要。特别是在当前的经营环境下,信息需要以更加认真的处理方式来对待。内容可以说是,数据存储位置和方式的又一决定性的因素。举例来说,信息技术人员在一段时间结束以后,是不能随便清除所有电子邮件文档的。其中的垃圾邮件,当然可以马上删除, 但是那些个属于业务交易、人力资源和财务等重要文档却应当被保留,作进一步的分类、储存和保护,为了更长期间内的使用。同时,由于这一信息可能在一定时期内都会有人要查阅,所以它也不应该被简单地移动到后备数据系统。在这里,关键的问题是识别的流程、制度规定以及方便实用的技术支持能力。
存储设备可以从成本考虑,分为高、中、低等各种不同的硬件平台,对应重要程度不同的、结构性不同的数据,然后还要选择相应的软件。
利用信息生命周期管理,可以将信息管理与业务目标相对应。这样在数据对业务的价值不断变化时,企业可以按照信息的当前价值来管理数据,从而获得:
信息生命周期管理(Information Lifecycle Management)对企业用户而言是一种信息技术战略、是一种理念,而不仅仅是一个产品或方案。信息化建设中最关键的是数据,数据代表着信息,它可以构成企业的核心竞争力。信息从产生的那一刻起就自然地进入到了一个循环,经过收集、复制、访问、迁移、退出等多个步骤,最终完成一个生命周期,而这个过程必然需要良好管理的配合,如果不能进行很好地规划,结果就会是,要么是浪费了过多的资源;要么是资源不足降低了工作效率。
上图表明了一般情况下,数据引用概率与数据寿命之间的关系,这是理解数据应当如何管理的关键所在。为信息在它的整个生命过程中规划存储和迁移的方案是ILM的核心内容。
信息生命周期管理最初由StorageTek首先提出来的,经过EMC的发展和大力宣传,进入市场化阶段指日可待。然而我们应当认识到,信息生命周期管理作为一项企业信息化战略,不可能一蹴而就,而是一项相对长期的工作。当代的企业或多或少都已经有自己的信息系统,信息生命周期管理不可避免地要利用和继承企业目前所拥有的技术和体系结构。
EMC公司的三阶段论
EMC公司建议客户分三个阶段实施信息生命周期管理:第一步,实施自动网络存储,优化存储基础设施;第二步,提高服务等级,优化信息管理;第三步,实施集成式生命周期管理环境。
第一个阶段,各机构应消除直连存储,逐步将存储完全网络化,然后实现存储环境自动化。以便经济有效地融合和控制存储资源,保证业务连续性。
第二个阶段,服务等级阶段的任务是:在存储网络中建立服务等级层次,然后部署初始信息管理工具,按照企业要求的变化,将信息转移到相应的服务等级层次中。利用这些工具,许多机构都能够按照相关法规的要求,优化其信息管理资源。
前两个阶段是最后实现价值的基础,一般情况下,需要若干年时间才能实现信息生命周期管理的自动化。在这种集成式环境中,客户将能够在整个混合IT基础设施中贯彻企业战略精神,并在适当的时候从一个控制台为一定的服务等级提供相应的应用。
第三个阶段,借助信息生命周期管理,企业不但能经常自动制定决策,保证按照预定的业务准则和战略,以便在适当的时候,为适当的应用提供适当的信息,还能按照信息价值变化的敏感性实时地进行调整。
这三个阶段使IT人员能够利用各项新技能和新方法了解自身的信息需求,并随着实际经验的积累提高自动化水平。
ILM的实施方案--自动化ILM体系
我们通过分析EMC提出的自动化ILM体系,来看看整个ILM的实施方案。
图1 自动化ILM体系
如图1所示,自动化ILM体系分为三个功能区域:
每个功能区域都包含很多的具体的服务模块。每个模块都清楚自己在整个自动化ILM系统内的位置和作用。通过一个称为ILM知识库的数据库来与其他服务共享基础数据。模块化的设计方式使得用户可以根据需要,自主决定ILM解决方案的组成。下面我们来讨论这些组成部分以及它们对于整个体系的作用。
自动化ILM体系的管理服务提供系统的操作管理功能。如图2所示,管理服务由四部分组成:应用程序、信息组、存储网络和平台。每层中都包括一组管理服务,每个服务提供一项具体的ILM流程功能。譬如,LEGATO网络服务可向信息组层提供备份/复位服务。
图2 管理服务
管理服务可以单独安装,也可以与其他的服务组合使用。自动化ILM框架并不限制使用的具体产品,通过通用标准的使用,自动化ILM为通用服务和自动化模块提供了公开的接口。这些开放性的接口允许任何的第三方管理服务、用户接口或是业务应用程序可以利用自动化ILM系统内各部分的功能,并整合它们。为了得到支持,管理服务必须和通用服务层的衔接,并在自动化ILM知识库中注册名称和服务类型。基础数据用来描述业务应用、信息组以及服务水平协议。举例来说,一个第三方复制产品必须在知识库中注册名称和服务类型,并为信息组提供一个复制。
1、应用服务
应用服务负责业务应用程序及其运行的主机环境操作。该服务包括高度的资产可用性、自动化和监控服务。这些服务通过监控应用程序及其运行环境和自动化恢复与服务流程,从而改进信息存取的可靠性。譬如,LEGATO的自动化可用性管理工具就是一个提供资产可用度保证的服务。这一服务对受控程序提供故障处理和重新启动的功能,从而为用户提供近似连续的应用服务和信息服务。
应用服务层通过ILM知识库中的基础数据进行定义。包括全部自动化ILM服务可识别的名称和服务水平协议。
2、信息组服务
信息组为某一个应用程序或业务流程相关的所有数据子集提供一个特殊命名的对象。该 名称和信息组的内容将为所有自动化ILM服务知晓并共享。由于信息组是管理服务经常操作的对象,它就构成了自动化ILM环境中的基本管理单元。举例来说,一个名为OracleInfoSet的信息组可能包括与Oracle数据库有关的数据表文件。信息组的名称和它的文件内容和属性也由自动化ILM知识库中的基础数据进行定义,信息组提供了每个管理服务所需要的输入信息。举例来说,备份服务会向信息组服务请求获得它所要备份的文件列表。基于信息组的协议,它还决定备份的目的地、频率和保存期间长度。这种配置信息的能力为所有ILM服务提供了标准化管理的可能。
3、存储网络服务
存储网络服务为物理存储设备与应用程序之间提供了一个管理接口。这些服务构成了一个抽象层,简化并提高了物理存储设备的分配和管理能力。存储网络服务可以对固定存储和移动存储设备进行操作,并对不同设备类型的细微差别进行调整适应。
图3 存储网络服务结构
固定存储管理
固定存储管理提供磁盘虚拟服务和卷管理服务。磁盘虚拟服务负责将不同类型的硬件设备集中化,形成一个统一的存储池。它通过将底层存储网络的复杂性隐藏起来,从而大大简化了存储管理工作。而卷管理服务则负责对不同存储设备的特征进行平滑处理,为应用程序和文件系统操作存储设备提供了一个抽象层面,它们使得物理上分散的多个磁盘看上去就象一个完整的存储系统。信息卷是自动化ILM主要依赖的功能之一。信息卷与传统意义的卷十分相似,只不过它是专门为具体应用的信息组服务并以ILM服务为最终目的。譬如备份和复制服务正是通过信息卷来完成的。
移动存储管理
移动存储有着自己独有的管理特点。它们包括设备虚拟、设备共享和介质跟踪。存储网络服务的设计就是针对这三项困难的。设备虚拟服务为移动存储设备提供一个通用的接口,该服务为不同的磁带、光盘驱动器以及它们的自动换片装置提供数据通道和控制功能。它也是一个隐藏了不同接口差异和管理的抽象层,从而为信息组服务提供了一套有效利用移动存储资源的管理方法。
由于移动存储设备比较昂贵,而且如果它们仅为特定目标服务(比如归档和备份)的话,就无法得到充分的利用,所以人们总是想方设法要共享这些设备,譬如磁带驱动器和自动换片装置。为了解决这个问题,存储网络层提供一个存储选择服务。这个服务功能负责控制设备的通道,并确定在出现两个以上服务同时请求使用一个共享装置的时候,只有其中一个得到控制权。这使得多个服务共享存储设备成为可能,尽管它们实际上是通过分时执行来实现的。多个服务共享设备做法可以节省大笔购买存储设备的费用并提供每个设备的利用效率。
IT部门的人员经常为查找一个移动存储介质(磁带和光盘等信息介质)头痛不已,更不用说在该信息的生命周期各阶段实施有效的管理了。问题的关键就在于,当一个磁带或是光盘脱离了驱动器和自动换片装置以后,要继续跟踪它摆放的位置和决定它的保存期限就变得十分困难。正是由于及时找到这些介质很困难,将信息复制移动存储设备的方法很少得到充分使用。而这正是跟踪服务对于ILM流程的重要性所在。它负责跟踪每个媒体的内容和位置(磁带或光盘)并记录好每个介质位置移动的过程。这为快速查找和充分利用移动存储设备提供了坚实的基础。跟踪服务同时也为用户提供保存管理,让用户及时了解每个移动介质的可使用期限。期满的媒体能够得到及时处理和再循环利用。通过管理这些介质的合理数量,从而降低了存储成本和费用。同时建立应用程序与移动存储设备之间的索引,大大提高了系统执行的速度。
检测和分配服务
这项服务涉及整个存储网络层的平台操作,帮助管理整个系统的硬件和软件存储资源。分配服务对从信息卷增加或移走的存储设备提供动态控制,而检测服务则检查当前可用的存储资源,并为可供分配的资源编制目录。这二项服务一起为磁盘虚拟和卷管理提供支持功能。当信息卷需要增加存储空间的时候,分配服务搜寻可用资源并为它分派新的存储空间。而分配服务依赖检测服务为其提供存储网络硬件的信息,包括磁盘驱动器、存储阵列、SAN、磁带驱动等等网络存储资源。检测到的存储资源由ILM知识库共享给其余的ILM服务,从而节省了系统冗余。
通用服务提供了一组可以共享的功能,为自动化ILM其他功能部分集中处理一些统一的
通用功能方法和模型。通用服务提供下列:
1、服务间通讯,提供了自动化模块与管理服务之间的通讯渠道。这一服务定义一个通用数据格式作为通讯的基础。它也提供一个目录服务使不同应用之间相互了解。
2、安全服务,为所有服务提供证明和授权服务。为不同的用户提供一套统一的授权控制机制。
3、报告,提供了关于ILM服务历史统计和数据汇集的工具。通用报告系统允许用户组合不同的服务信息,并通过应用程序的视角,进一步挖掘信息背后的内容。举例来说,它可产生关于某个特殊电子邮件应用的全部信息报告。
4、事件管理,提供一个集中的知识库,为查看和保存系统内各ILM服务事件实施有效管理。
5、通用资源检测,检测可用的通用硬件和软件, 编制目录使所有自动化ILM流程可以共享它们。这将减少每个应用各自检测的工作,并为资源提供一个通用的名称。
6、监控和服务服务,为自动化ILM环境提供了自我修复的功能。这些服务结合在一起,为系统内各问题的识别和自动纠正提供了通用的方法。
7、安装和配置服务,提供一种安装和更新软件的通用方法。这一服务管理软件模块的新版本更新和整个系统环境中的分配。
8、许可服务,提供全部自动化ILM软件模块的许可协议控制、统一的管理和报告。
自动化模块利用自动化ILM系统的管理服务和通用服务提供的功能,来完成更高级操作。它包括:
1、协议管理模块
在所有自动化ILM给企业带来的效益中,协议驱动管理可能是受益最大的。这个自动化模块通过使用服务水平定义来自动化配置操作和服务水平管理,从而简化了ILM流程并降低了费用。协议驱动管理通过引入业务需求,为提供提供管理服务智能。
自动化ILM协议管理负责系统协议管理。如图 4 所示,协议管理使用协议和资源数据来控制和协调服务水平。
图4 协议管理
通过读取知识库中的分类基础数据和服务水平协议,协议管理确定对具体应用程序和信息组提供怎样的服务支持,它负责配置需求服务来保证协议得到贯彻。当服务水平配置完成后,协议管理通过监控低层管理服务的运行,来保证和验证它们的正确执行。
举例来说,如果一个应用被归入接受“标准的保护服务”类别,并且这一服务水平定义为应用数据每个晚上都需要备份,那么协议管理工具将检测备份服务的执行,确保信息得到正确的保护。如果应用数据没有被备份,一个可见的通知将送达管理控制平台,提醒管理人员,服务水平协议没有得到执行,同时一份电子邮件或短信将送到适当管理者的手中。
服务水平协议被用来定义广泛的管理能力,包括:
*“关键的”核心应用程序,必须在20分钟内得到恢复。
协议管理使得管理人员可以容易管理一组应用程序的服务水平,增加或降低服务等级,而修改服务水平协议可以影响所有受控的应用程序。这种能力将配置工作的复杂性简化了,并为ILM提供了量化的配置方法。
2、情景管理模块
当ILM的自动化程度越来越高的时候,用户可能会在启动服务水平协议前,想了解它的可能结果。而ILM本身也需要具备为服务水平目标(SLO)提供推荐协议的能力。这些能力就是我们知道的“情景分析”(what-if),或者说是预测模型。情节管理是帮助这方面的支持,它仰仗于对不同情景影响的叙述、探究和评估的能力。在某项改动之前,通过情景分析,可以使用户对改动后的影响有一个直观的了解,做到心中有数。
3、工作流管理模块
工作流管理负责协调复杂的ILM工作流程,这些流程经常需要人员操作的介入。工作流程管理需要自动化ILM系统与IT部门和业务部门共同合作。
图5 工作流管理
工作流程定义工作的顺序步骤和必要的批准环节,而批准环节就需要集IT部门人员的参与。譬如说,协议管理需要一个附加的存储空间,这将启动一个工作流请求。第一步是识别符合应用程序需要的存储设备,这可以由分配服务自动完成。在空间得到分配之前,这项需求的业务线经理拥有成本费用批准权。工作流程管理将请求通过电子邮件发往业务经理,业务经理批准后,存储扩展流程得以继续。
图5说明了工作流程控制操作的基本步骤。流程从请求(1)开始到达工作流管理系统,流程经理查询(2)自动化ILM知识库获得工作流程定义作为操作依据,而且启动第一个自动化流程(3)。该流程完成后,送出一个请求(4)给指定的用户并等候批准(5),接到批准后继续下一个自动步骤。
4、分类管理模块
对信息进行识别和分类是管理人员最头痛的一件事情。分类管理模块负责帮助管理人员
识别和分类已存在的应用程序和信息。使用信息检测技术,和分类模板来刻画程序和数据使用特征,分类管理模块帮助用户建立适合企业的初始分类,并对现有程序和信息的分类提供建议,然后用户可以接受、拒绝或修改这些分类建议。分类定义完成以后,通过基础数据记录在自动化ILM知识库中,可以被其他ILM服务调用。当企业环境中有大量的数据要处理,分类管理模块能够大大地提高信息分类处理速度。
5、服务水平管理
服务水平管理位于自动化ILM结构的顶层。服务水平管理监控并处理在业务部门和IT部门之间建立的服务水平协议(SLA)。服务水平管理维护应用程序、ILM服务以及业务部门之间的三方关系。服务水平管理获取业务部门对某项应用程序的服务水平需求,然后提供评估和跟踪功能,以确保该项服务水平得到实施。如果服务水平没有达到标准,业务部门和IT部门将接到通知,他们要么修改需求,要么纠正系统来解决问题。服务水平管理也提供“费用反馈”功能,它向业务部门报告该部门使用的IT资源和相关费用。
为实现信息生命周期管理的全部优势,需要考虑一个由以下三个基本模块组成的构架:
信息生命周期管理大致需要进行以下步骤:
首先,盘点已有的信息系统。由于大多数时候,信息生命周期管理不是投资建立一个全新的基础结构,而是要在已有的基础上构建和创建完整的信息管理,所以,企业首先需要理清自身的资产,认识现有信息系统的优点和弱点,为下一步信息生命周期管理的开展大好基础。
然后,实现存储网络化和整合。迁移到自动化网络存储环境为企业提供了基于战略进行管理的基础,以及手动开发分层存储平台价值的功能。通过整合服务器和存储设备来降低成本,通过集中存储管理降低复杂程度,增强业务连续性,以及在不中断业务的情况下灵活地扩大或缩减规模。
接着,将服务级别与数据价值相匹配,实施有针对性的信息生命周期管理。通过对数据和应用程序分类并将其与业务流程结合在一起,可将信息生命周期管理提升一个级别。企业将对存储资源实现更好的管理和最优分配,获得根据变化的性能和可用性要求,存储信息的能力,将服务级别与相应存储解决方案进行匹配,并且提高业务连续性和法规符合程度。
最后,实现管理与控制自动化,实现跨应用的企业级信息生命周期管理。这一阶段,开始规划企业整体范围内自动化的、基于战略的信息管理方案。产品和服务在该阶段中不断完善和创新,将实现企业范围内自动化管理和控制,在企业内保持服务级别和数据价值的一致,并且不断地进行自动调整,以确保业务制度和规则在适当的时间将信息传递到正确的应用程序。
一个成功的信息生命周期管理战略,应当具备以下的标准:
1、以业务为中心:信息技术应当和企业实务相结合,与关键业务流程相匹配、与应用程序以及商业目标保持一致。
2、以制度为基础:许多信息的储存年限、方式以及可接触人员,受到政府法规的管制,CIO需要确保系统实施方案能够体现和达到政策的要求。
3、集中化管理:为了能够全面地控制和管理企业全部整合的信息资产,包括结构化的和非结构化的信息,信息生命周期管理必须采用集中化管理。
4、能够处理异质环境:由于信息系统需要在整个企业内运行,信息生命周期管理一定要全部包含各种平台类型和操作系统。
5、与数据价值相关:信息生命周期管理的关键一点是按照数据信息对于企业而言的价值高低来安排适当的存储设备的能力。这样使重要的信息得到足够的保护,而同时一般信息的存储成本也得到控制。
信息生命周期管理的成功实现,还需要企业业务流程的全面配合,对于流程的评估可以借鉴以下的成熟度模型。