第Ⅰ部分 网格计算
第1章 引言
在今天这个任何时候任何地方都普遍需要信息的世界上,蓬勃发展的网格计算环境已经被证明拥有重大的意义,以至于经常被人们提到是世界上惟一且*具威力的计算机解决方案。人们已经认识到由于网格计算的众多优势,我们被纳入到了一个错综复杂的全球环境中,该环境通过多种多样的实现手段大大影响了众多的开放标准和技术。事实上,如今世界上那些具有复杂性和动态特性的工业问题,远远不��采用更多传统的单个计算平台的方法就能够解决的。
网格计算等价于世界上*大的计算机
网格计算学科涉及到实际的联网服务,以及在一个“网格”内可能是无限数量的、随处存在的计算设备的连接。这种创新性的计算方法可以*简单地想象为一个具有巨大能量的“效用”网格,例如它每天分别为我们的家庭和公司提供其强大的能量。这种基于公用的能量的传输对我们中的大多数人来说已经成为了习惯。我们都知道,如果走进一个房间并打开电灯开关,此时能量立即就会直接传输到我们所选择的这个设备中。根据同样的公用方式,网格计算公开地寻找并且能够将无穷多的计算设备添加到任何网格计算环境中,从而在运行的网格环境中增强计算能力并且增加用于解决问题的任务的数目。
当我们继续前进并进入这个具有强大能量的基于网格问题解决方案的新纪元时,网格计算惊人的问题解决能力依然是未知的。
在本引言中,我们将首先给出许多关于网格计算方面的主题,这些主题将在整本书中进行讨论。第1章中的讨论将只是试图提供网格计算比较**别的一种概述。在本书的后续章节中,我们将会给出全世界正在利用和开发网格计算的许多团体关于这些主题的全面论述。
全球性的业务需求要求具有强大的问题解决能力以应付那些异常复杂的问题,这一需求已经促进了全球工业部门对众多到处存在的计算资源进行动态协作,以便能够共同工作。这些对困难的计算问题进行解决的需求现在实际上已经给所有的计算技术带来了不少复杂性,它们给现有的技术环境带来了操作方面的问题并且增加了成本。然而,这种**的协同计算能力又的确是几乎所有工业和业务领域的问题解决所必需的,其范围囊括了从科学研究、商务解决方案一直到学术上的努力。在终端用户必要的质量要求的约束下,要想通过所有的技术团体来获得满足解决这些复杂的动态问题所需的该级别的资源协作,无疑是一种困难的挑战。
为了进一步阐述这种环境,我们考虑一些人们可能已经遇到的普通用例(use case)的情况,它将检验一个网格计算解决方案环境的许多价值。为了介绍网格计算的概念,我们给出如下简单的用例:
•金融组织用于处理财产管理的应用需要不同部门的协作以获得更强的计算能力和软件建模应用。它汇集了大量的计算资源,因此在任务的实时执行和对复杂的数据存储池进行直接访问时能够运行得更快。其*终结果就是以更快的周转时问增加了顾客的满意程度。
研究大气臭氧层的科学家小组每天都将采集庞大的实验数据。这些科学家需要**、复杂的数据存储能力以跨越广泛地域分布的存储设备,并且能够根据数据处理的需要以**的方式访问这些数据。其*终结果就是得到用于重要科学研究的更为有用和**的方法。
对于拥有许多在线游戏参与者的大型社区而言,大规模的多个玩家在线游戏的场面出现时,就需要大量的游戏计算机服务器来替代专用的游戏服务器。这样,互联网游戏的玩家们像在一个组中一样以一种实时的方式进行互动。这种方式涉及到计算机资源的按需分配和供应、复杂网络的供应与自我管理以及复杂的数据存储资源等要求。这种按需要求是动态的、时刻变化的,并且常常根据任意给定时刻系统的工作负载而会立即变化。*终结果是对于大型的游戏社区,要求更为复杂的基础设施来承担通信流量,为游戏公司的财务带来更多的利润,并且能够提高顾客参与游戏的满意程度。
对于研究自然灾害(例如化学制品泄漏事件)的政府组织来说为了更好地做出计划并且控制灾难,他们需要立即协调不同的部门。为了计算泄漏物的扩散以及对天气的影响,或者要确定对人类健康因素的影响,这些组织需要对许多与泄漏相关的计算模型进行模拟。*终结果是为公共**问题、野生动物的管理与保护问题以及生态系统保护问题提供了保护和**:不用说,所有的这些问题都是利害攸关的。
如今,网格计算提供了许多已经用于解决上述问题的方案。人们使用了多种技术和开放式标准来构造网格计算方案。反过来,网格计算也提供了一种具有高度可伸缩性、高度**性以及使用无缝方式来寻找并协商对远程计算资源进行访问的性能极高的机制。这使得在一个**的范围内,无数地域上分布的组之间的计算资源共享成为可能。网格计算作为围绕计算实践的个体和团体实现的一个重要转换代理,能够将它们转换成为在概念上与电和水相似的通用效用。这些像电和水一样类型的效用,更像网格计算中的效用,是“按需”提供的,并且将总是能够为个体或团体提供一直可用的资源。
在这本全新且令人感兴趣的书中,我们将给出网格的早期定义,以此来开始我们对网格计算系统核心概念的讨论。早在1998年,人们就对网格进行了如下定义:计算网格是_个硬件和软件的基础设施,它提供了可靠的、一致的、普遍的以及廉价的方法来获得高端的计算能力(Foster&Kesselman,1998)。
一早先的这个定义更多地以网格计算的计算方面为**,而其后的复述则拓展了它的定义,更多地集中在协同资源共享和多个机构的虚拟组织(Virtual Organization,vo)内的问题解决上(Foster&Kesselman,。l998)。除了协同资源共享和动态虚拟组织这些条件以外,开放式标准成为了一个关键性的基础。在整个网格的实现中,开放式的标准是非常重要的,为了提供能够进行交互以及可扩展的基础设施环境,它同样也容纳了多种其他的基于标准的开放性协议和框架。
网格计算环境必须由以下基础构建而成:
•协同资源。我们应该避免使用集中式控制的方式来构建网格系统,而是应该基于各自的策略以及服务水平协议(Service Level Agreement,SLA)为资源之间的协同提供必须的基础。
•开放式标准协议和框架。开放标准的使用提供了相互协作和集成的可能性,这些标准必须应用于资源发现(resource discovery)、资源访问(resource access)和资源协同。(resource coordlnatlon)。
对网格计算系统的另一个基本要求是具有向终端用户社区提供必须的满足服务质量(Quality ofService,QoS)需求的能力。这些服务质量的有效性必须成为任何网格系统的基本特征,同时也必须与可用的资源列表(resource matrix)一致。例如j服务质量的特征可以是响应时间测度、聚集性能(aggregated performance)、**实现(security fulfillment)、资源可伸缩性(resource scalability)、可用性以及对事件相关性、配置管理、局部故障转移(partial fail OVer)机制进行自主管理的特征。
现在已经有很多致力于研究网格计算的上述定义和网格系统需求的工作。其中*引人注目的成就是用于网格计算基础设施实现的接口和协议的标准化。我们将在本书的后面部分讨论这些细节。现在就让我们来探讨早期以及当前的网格计算系统,并且根据各自的优点来探讨它们之间的区别。
1.1 早期网格工作
在过去的几年中,全世界对计算性的网格计算产生了极大的兴趣。我们也注意到了网格计算的众多衍生物,其中包括计算网格(Compute Grid)、数据网格(Data Grid),科学网格(ScienceGrid)、访问网格(Access Grid),知识网格(Knowledge crid)、集群网格(Cluster C,rid)、大地网格(Terra Grid)及商品网格(Commodity Grid)等。对这些网格仔细地考察过后,我们可以发现它们全都共享一定形式的资源,当然,这些网格也可能具有不同的体系结构。
不管是一个商品公用网格还是一个计算网格,网格的关键价值常常是依据它在业务上的优点和用户各自的满意程度来衡量的。其中,用户的满意程度是根据网格提供的服务质量来衡量的,例如可用性、性能、访问的简便性、管理方式、业务价值以及价格灵活性等。业务上的优点则常常与网格解决的问题相关并且由此体现。例如,它可以是作业执行、管理方式、工作流模拟以及其他关键的基于技术的基础。
在网格计算方面,较早的努力是与数据的重叠功能领域、计算以及它们各自的访问机制相结合的。我们将进一步探讨这些领域的详细情况,以便能够更好地理解它们的利用和功能需求。
……