电脑开发与应用
主办单位:中国兵器工业集团公司
国际刊号:1003-5850
国内刊号:14-1133/TP
学术数据库优秀期刊 《中文科技期刊数据库》来源期刊
       首 页   |   期刊介绍   |   新闻公告   |   征稿要求   |   期刊订阅   |   留言板   |   联系我们   
  本站业务
  在线期刊
      最新录用
      期刊简明目录
      本刊论文精选
      过刊浏览
      论文下载排行
      论文点击排行
      
 

访问统计

访问总数:15786 人次
 
    本刊论文
基于网格计算的容灾系统设计
  【摘 要】网格计算技术的出现,实现了对海量数据的高效率处理;基于网格计算技术的容灾系统成为信息安全领域倍受关注的研究方向,较之传统的容灾系统,它的应用使系统性能得到了跨越式的提升。本文介绍了容灾系统的概念和基于网格计算容灾系统的关键技术,并对其进行了总体的构架。

  【关键词】容灾系统;网格计算;备份;恢复

  1.引言

  当今社会已步入信息社会,数据在人类社会活动中扮演着重要的角色。然而,没有任何保护措施的数据易受到各种自然灾害或人为因素的破坏,后果不堪设想。保护数据,最重要的手段是备份。虽然传统的备份技术在一些情况下可以有效地保护数据,但在发生诸如地震、恐怖袭击等大规模灾难时,传统的备份往往无能为力,主要原因是受制备份系统对海量数据处理的底效率、备份数据不能快速实现异地存储,这样使得传统备份技术在今天已很难胜任。网格计算技术的发展,使我们获得了超级计算能力,能高效率处理海量数据。建立基于网格计算技术的容灾系统能很好解决传统备份技术的瓶颈问题,实现对数据最为科学、合理的备份。

  2.容灾系统的概述

  对于计算机系统来说,灾难是指一切引起系统非正常停机的事件。造成计算机系统灾难事故的原因有自然灾害、计算机系统故障和各种人为因素,等等。这些事故直接造成计算机系统数据丢失。

  容灾系统就是在计算机系统非正常停机时,对计算机系统数据进行有效备份,之后通过管理员及时恢复备份的数据并重新组织系统运行,使计算机系统使用者能够正常工作的系统。因此,容灾系统是由容灾备份和数据恢复两部分组成。

  容灾备份的主要目标是:保护系统和数据的完整性,使系统数据损失最少甚至无损失。数据恢复主要是使管理人员在最短时间内恢复备份的数据,使系统正常运行。

  2.1容灾备份的衡量指标

  衡量容灾备份的主要技术指标为恢复点目标RPO(Recovery Point Object)与恢复时间目标RTO(Revovery Time Object)。其中,RPO指灾难发生时与最近一次数据备份时的时间间隔,代表丢失的数据量;RTO指系统从灾难发生到重新启动的时间,表示系统恢复的能力。

  RPO主要针对的是数据丢失,代表容灾系统性能优越的指标。RTO针对的是服务丢失,是衡量应用容灾的指标,在数据容灾的基础上,在灾难备份中心建立一套完整的与生产系统匹配的备份应用系统。灾难发生时,灾难备份中心可以迅速接管业务,最大限度地降低丢失的数据量,并且能最大相对地减少系统恢复时间,保证系统不间断地运行。

  RPO与RTO之间没有关联性。RTO与RPO必须在进行风险分析和业务影响分析后根据不同的业务需求确定。

  2.2 灾难备份的级别

  根据数据中心对RPO与RTO要求的不同,按照国际标准,灾难恢复水平可以划分为下表所示的七个等级:

  表 1

  从上表中,我们能看出高性能的容灾系统都是基于网络实现的。

  2.3 数据复制技术与方式

  在建立容灾备份和恢复系统时会涉及多种技术,如数据复制、SAN/NAS、快照、集群,等。其中,数据复制技术是灾难备份系统的核心。数据复制技术主要是将生产中心的数据复制成容灾备份数据,容灾备份数据与生产数据应保持一致。目前,数据复制的主要方式分为:同步复制与异步复制。

  2.3.1 同步复制

  同步复制的主要原理是在主机向本地磁盘写数据的同时,将数据传到备份中心的系统,在确认远程备份系统的数据同步更新后,完成写数据的操作。

  同步复制的数据实时性强,灾难发生时备份能够与生产数据保持一致,几乎没有数据丢失。其缺点是由于数据更新操作时间长,影响应用性能。

  2.3.2 异步复制

  异步复制的原理是在主机系统向本地写磁盘数据后,将本地生产数据在后台复制到异地。

  异步复制对数据的更新不必等本地卷和备份卷的数据都更新完毕后才算是更新完成,因此减少了更新操作的时间,同时对主机性能的影响较小。但是,由于不同步,可能出现数据的丢失。

  选择复制模式应该结合自身的容灾目标和实际情况来考虑。如果优先考虑系统性能,同时能够接受备份中心数据更新的较小延迟,就应该采用异步复制方式。反之,就可以考虑采用同步复制方式。

  2.4 容灾系统的效率及风险防范

  容灾系统的建立必然会带来一些效率问题。例如,为达到数据的实时备份,将采用数据的同步备份方式,这样会对应用系统的效率带来一定影响。因此,在灾备系统的设计时既实现灾备的功能,又能保持系统运行的效率,是一个重要问题。

  容灾备份和恢复技术十分复杂,其中涉及业务风险分析、方案选择、实施等多方面内容。在灾难备份系统的实施中将涉及数据的完整性和安全性等问题,在灾难恢复计划中涉及业务风险,因此,如何采取安全、可靠的方式进行灾难备份,如何防范恢复过程中的风险,也是需要认真研究的问题。

  结合上叙介绍,我们能看出容灾系统对系统自身的效率、适时性、安全性要求极高,如何来优化容灾系统性能?将网格计算技术应用到容灾系统中:运用网格计算技术动态调度管理容灾系统内各种设备、提供对海量数据的实时存储、在设备和远程存储系统之间提供传输服务,这样便实现了对容灾系统性能的优化。

  3.基于网格计算容灾系统的设计

  今天,计算机硬件性能及网络性能不断提升,随着网格计算技术的成熟,为我们建立基于网格计算的容灾系统提供了有力支持。
 3.1 网格、网格计算的介绍

  网格(Grid),是一个集成的计算与资源环境。网格能够充分吸纳各种计算资源,并将它们转化成一种随处可靠、经济的超级计算能力。除了各种类型的计算机,这里的计算资源还包括网络通信能力、数据资料、仪器设备等相关资源。

  网格计算(Grid Computing),是对基于网格问题的求解。

  网格中的网格资源主要是指分布的计算机资源,而网格计算就是指将分布的计算机组织起来协同解决复杂的计算问题。

  3.2 建立基于网格计算容灾系统的关键技术

  容灾系统作为一个整体,它通常由分布于异地的若干子模块组成。在网格出现之前,人们就构建了容灾系统,但系统性能取决于构建它的成本,并且系统性能并不稳定,随着网格技术的推广应用,系统构建成本得到降低的同时,也实现了容灾系统整体性能大幅度的提升。

  在容灾系统内,需要在第一时间内响应用户的请求,并且要确保数据的安全性。

  3.2.1 基于网络的海量存贮系统 HPSS

  由表1可看出,高级别的容灾系统都是基于网络实现的,因此需要使用基于网络的海量存贮系统,之所以如此,是因为系统运行时会产生大量的数据,而且这些数据都需要存贮、管理并支持来自异地的访问,所以使用海量存贮系统(HPSS)是很必然的选择。

  随着科技的进步,海量存贮系统的性能不断被刷新着:1994年数据存贮系统的容量达到10TB,吞吐量达到10MB/S;1997年,容量达到100TB,吞吐量达到100MB/S;2000年,容量达到100PB,吞吐量达到1GB/S。

  HPSS是一个层次化的存贮系统,主要为高性能计算产生的海量数据提供快速存贮服务,以弥补计算能力与I/O吞吐能力之间的差距。

  HPSS主要设计目标是让海量数据能够在网络化存贮、高性能计算机、集群计算机、海量数据库之间快速传递。它有如下特征:

  HPSS中的所有计算机和存贮结点都直接连接在网络上,数据在提供者与需求者之间直接传递,无需经过中间结点。

  HPSS把数据分散在多个节点上,这些节点并行传送数据,因而吞吐量接近这些节点吞吐量之和。

  HPSS支持事务的原子操作-----对于一次操作,要么彻底完成,要么回滚到操作开始之前的状态,从而保证了数据的完整性;

  HPSS是一些软件模块的集合,每个模块担负一个任务,模块之间通过API提供的调用接口,实现组合使用。

  HPSS不需要特定操作系统的支持,它用ANSIC书写,调用POSIX功能,因而可以运行在许多平台上。

  HPSS的性能可以动态扩展,允许随时将新的服务器、存贮设备等,加入到HPSS的网络存贮池中,从而满足系统不断增长的应用需求。

  对于容灾系统而言,HPSS的应用提供了高性能的数据缓冲和存贮服务,优化了系统恢复点目标(RPO)与恢复时间目标(RTO)的值,使系统能够在最短时间内完成数据的备份和恢复。

  3.2.2分布式监控

  在容灾系统中,网络存贮器、大型计算机等各种设备分散于各地,需要进行全局协调和管理,这些工作可以由分布于各地的代理程序来完成。除了完成特定的功能外,代理程序还必须支持全局性的监控。

  当系统出现故障时,就需要代理程序担负起分布式监控的任务,它们实时记录下每个有潜在意义的事件,为全局的实时监控提供支持。处于系统关键点的代理程序,还需要对某些关键性能参数作记录,支持对系统性能的分析和调整。

  3.2.3基于策略的访问控制

  容灾系统的安全管理非常复杂,基于高级别安性性的要求,不可能人工完成每一次授权,也不可能让用户只要有一个口令就通行无阻。

  解决这个问题最为有效的途径就是让所有设施的使用者拥有唯一标识自己身份的授权,系统资源访问控制部件负责收集所有这些授权,并在用户发起授权申请时,用一个策略控制引擎代替所有的授权人完成授权操作。这样,在及时完成授权的同时,不影响合法用户对资源的正常访问,从而从整体上提升了系统的性能。

  3.3 基于网格计算容灾系统的设计

  通过上述分析,我们可以知道:容灾系统最为关心的是数据备份和数据恢复的及时性、完整性、安全性,将网格计算技术融合到容灾系统中(如下图所示),可以很容易解决上述问题,而且能大幅提升容灾系统的性能:

  4.结束语

  信息化社会的到来,决定了人们对数据安全要求不断的提升,传统的数据备份系统已无法满足人们在这方面的需求。网络技术的发展,为人们构建高级别容灾系统提供有力的技术保障。

特别说明:本站仅协助已授权的杂志社进行在线杂志订阅,非《电脑开发与应用》杂志官网,直投的朋友请联系杂志社。
版权所有 © 2009-2024《电脑开发与应用》编辑部  (权威发表网)   苏ICP备20026650号-8