CN101099132A - 提交给网格环境的网格作业使用前的资源功能性验证 - Google Patents

提交给网格环境的网格作业使用前的资源功能性验证 Download PDF

Info

Publication number
CN101099132A
CN101099132A CNA2005800461261A CN200580046126A CN101099132A CN 101099132 A CN101099132 A CN 101099132A CN A2005800461261 A CNA2005800461261 A CN A2005800461261A CN 200580046126 A CN200580046126 A CN 200580046126A CN 101099132 A CN101099132 A CN 101099132A
Authority
CN
China
Prior art keywords
grid
resource
execution environment
new resources
test
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005800461261A
Other languages
English (en)
Other versions
CN100578455C (zh
Inventor
克雷格·W·费伦斯坦
里克·A·汉密尔顿第二
乔西·约瑟夫
詹姆斯·西曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101099132A publication Critical patent/CN101099132A/zh
Application granted granted Critical
Publication of CN100578455C publication Critical patent/CN100578455C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/004Error avoidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0681Configuration of triggering conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0893Assignment of logical groups to network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0894Policy-based network configuration management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity

Abstract

提供了一种方法、系统和程序,用于在由提交给网格环境的网格作业使用之前,验证资源功能性。当新的资源被分配到由网格管理系统管理的、网格环境内的特定的执行环境时,网格验证服务在由网格管理系统控制的新资源上,自动地选择并运行至少一项功能性测试。响应于功能性测试的结果,在允许将该网格作业路由到新资源之前,该网格验证系统验证该测试结果是否符合期望的结果,使得在允许访问新资源之前,该新资源的功能性被自动地验证,以保持处理各网格作业中的服务的质量。

Description

提交给网格环境的网格作业使用前的资源功能性验证
技术领域
本发明通常涉及改进的网格计算,特别是涉及为网格环境之内的各资源进行资源功能性的自动验证。更特别地是,本发明涉及在允许提交给网格环境的网格作业路由至各资源之前,验证网格资源功能性,使得确保处理各网格作业的各资源的功能性。
背景技术
自从两个计算机系统之间进行第一次连接之后,经由连接,在两个计算机系统之间传输数据、资源以及其它信息的新方法就持续发展。在典型的网络架构中,当两个计算机系统正在经由连接交换数据时,一个计算机系统被认为是发送请求的客户端,而另一个被认为是处理请求并且返回结果的服务器。在努力提高处理请求的速度时,服务器系统在尺寸和速度上持续扩展。进一步,在努力处理当每秒钟到达多个请求的峰值时段时,服务器系统经常结合到一起作为群(group),各请求在群组的(grouped)服务器中被分配。已经开发了群组(grouping)服务器的多种方法,如集群(clustering)、多系统共享数据(sysplex)环境以及企业系统。在服务器机群(cluster)的情形,一台服务器典型地被指派来管理各进入请求和各输出响应的分布。其它服务器典型地并行操作,以处理来自各客户端的分布的请求。因此,机群中的多个服务器之一可服务客户端请求,而不用客户端检测服务器机群正在处理该请求。
典型地,各服务器或各服务器群运行在特别的网络平台上,如Unix或Unix的一些变形,并提供主机环境以运行各应用。每个网络平台可提供各功能,范围从数据库集成、集群服务以及安全到工作负载管理和问题确定。每个网络平台典型地提供不同的实现、语义(semantic)行为以及应用编程接口(API)。
然而,仅仅群组各服务器到一起以扩展处理能力,是改进网络中的响应时间的效率的有限的方法。因此在公司网络内,与日俱增地,各服务器和各服务器系统的群被组织为分布的资源,而不是仅仅群组各服务器。加大了努力以在公司网络内以及公司网络外的各服务器之间的合作、共享数据、共享各周期(cycle)以及改进交互的其他方式。进一步,加大了努力以将各非必要组件从一个公司网络外包(outsource)到服务提供商网络的组件。而且,存在如下趋势(movement):协调未服从(subject to)同样管理系统的各资源之间的资源共享,但是仍然处理安全、策略、支付以及会员资格的问题。例如,个人桌面上的资源,典型地未服从同样的管理系统,成为公司服务器机群的资源。即使公司网络内的不同管理组也可能实现截然不同的管理系统。
分散资源的问题已经导致网格技术的发展,所述网格技术使用各公开标准用于操作网格环境,所述各资源从运行在不同网络平台的服务器和其它计算系统(位于不同的区域、具有不同的安全协议,并且每一个由不同的管理系统控制)可获得。网格环境支持在动态、分布式及虚拟组织中共享和协同使用不同的资源。当各资源的选择被组织来处理作业请求时,虚拟组织在网格环境内被创建,所述各资源来自地理上分布的各系统,该系统由具有不同的政策和管理系统的不同组织运行。
尽管各机群或其它各服务器群可以在网格环境内被群组,然而网格技术不解决与确保性能和服务的质量相关联的所有问题,其中各资源的群由具有处理网格作业的不同标准的不同管理系统管理。特别的,网格技术的贡献和好处是,各资源在周围被移动到不同的虚拟结构中,也被称作执行环境,以优化可用的资源。提交各作业到任何计算系统的各客户端,期望提供来处理网格作业的各资源是功能性的。然而,网格环境中的问题是,随着每个资源重新分配到新的执行环境,然而资源的功能性不再被验证。例如,当网络适配器被分配到新的执行环境中时,网络适配器的连接性不再被验证,除非系统管理者运行测试来确保该网络适配器的连接性。随着网格环境中资源和资源重新分配的数量的增加,利用系统管理者来为每个资源手动地选择和运行测试,将劣化性能。
鉴于前述,需要有一种计算机实现的方法、系统和程序,用于在将网格作业路由至资源之前,检测执行环境中的各新资源、测试每个资源的功能性、并且验证该资源的功能性,以确保提交到网格环境的每个作业的服务质量。
发明内容
鉴于前述,本发明通常提供改进的网格计算,并且特别是为在网格环境内的各资源的资源功能性的自动验证。更特别的是,本发明涉及在允许将提交到网格环境的网格作业路由到执行环境中的各资源之前、验证执行环境内的各资源,使得确保处理各网格作业的各资源的功能性。
在一个实施例中,当新的资源被分配到网格环境内的特定的执行环境时,网格验证服务在由网格管理系统的控制的新资源上自动地选择并运行至少一项功能性测试,所述网格环境由网格管理系统管理。响应于功能性测试的结果,网格验证系统在允许将该网格作业路由到新资源前,验证该结果是否符合期望的结果,使得在允许访问新资源之前,该新资源的功能性被自动地验证,以保持处理各网格作业中的服务的质量。
当新的资源被增加到之前已测试功能性的各资源的、存在的执行环境时,网格管理系统可检测到:新的资源被分配到特定的执行环境。此外,网格管理系统可检测到,新的资源被分配到特定的新建立的执行环境,因此该执行环境中的所有资源需要测试功能性。进一步,网格管理系统可检测到新的资源被分配到特定的执行环境,以替代该执行环境中有缺陷的资源。
当在新资源上运行至少一项功能性测试时,可以根据资源的类型、以及根据资源的类或资源品牌(brand)进一步指定的,选择各测试。一类功能性测试从网格管理系统指引测试作业到新的资源,并且收集该测试作业的测试结果。另一类功能性测试调用允许在本地(local)测试新资源的诊断工具,并且接收指示各测试结果的日志文件。
如果在结果中检测到错误条件,网格验证服务可尝试解决该错误。如果该错误被解决,那么网格验证服务验证新资源的功能性。作为替代,如果错误没有解决,那么网格验证服务指明该错误,并且网格管理系统可尝试取代该资源。
从第一方面来看,本发明包括一种方法,用于为网格环境里提交的网格作业验证特定的执行环境内的资源,其包括:在由网格管理系统管理的网格环境内,检测特定的执行环境中的新资源,其中所述特定的执行环境包括为处理网格作业而群组的多个网格资源;在由所述网格管理系统控制的所述新资源上运行至少一项功能性测试;以及响应于接收所述至少一项功能性测试的结果,在允许将所述网格作业路由到所述新资源之前,验证所述结果是否符合期望的各结果,使得在允许访问所述新资源之前,所述新资源的功能性被自动地验证。
优选地,本发明提供一种方法,其验证特定的执行环境中的资源,其中,在由网格管理系统管理的网格环境内,检测特定的执行环境中的新资源,进一步包括:检测所述新资源,其中所述新资源被添加到所述执行环境,所述执行环境包括之前测试过功能性的多个资源。
优选地,本发明提供一种方法,其用于验证特定的执行环境中的资源,其中在由网格管理系统管理的网格环境内,检测特定的执行环境中的新资源,进一步包括:检测所述新资源,其中所述新资源被添加到所述执行环境,所述执行环境包括要求测试功能性的多个附加的资源。
优选地,本发明提供一种方法,其用于验证特定的执行环境中的资源,其中在由网格管理系统管理的网格环境内,检测特定的执行环境中的新资源,进一步包括:检测所述新资源,其中所述新资源被添加到所述执行环境以替代有缺陷的资源。
优选地,本发明提供一种方法,其用于验证特定的执行环境内的资源,其中在由所述网格管理系统控制的所述新资源上运行至少一项功能性测试,进一步包括:从所述网格管理系统将测试作业导向所述新资源;以及接收所述测试作业的测试结果。
优选地,本发明包括一种方法,其用于验证特定的执行环境内的资源,其中,在由所述网格管理系统控制的所述新资源上运行至少一项功能性测试,进一步包括:调用能够在本地测试所述新资源的诊断工具;以及从指示至少一个测试结果的所述诊断工具接收日志文件。
优选地,本发明提供一种方法,其用于验证特定的执行环境内的资源,进一步包括:对多个指定的错误条件,分析所述结果;以及响应于从所述多个指定的错误条件检测至少一个错误,尝试解决所述至少一个错误;以及响应于解决所述错误,验证所述结果是否符合所述期望的结果。
优选地,本发明提供一种方法,其用于检查特定的执行环境内的资源,进一步包括:响应于所述错误保持未解决替换所述执行环境中的所述新资源。
优选地,本发明提供一种方法,其用于验证特定的执行环境内的资源,进一步包括:接收至少一项来自提交所述网格作业的客户端的测试标准;以及响应于允许将所述网格作业路由到所述新的资源,当执行所述网格作业时,按所述至少一项测试标准运行所述至少一项功能性测试。
优选地,本发明包括一种方法,其用于验证特定的执行环境内的资源,其中所述网格管理系统管理将所述网格环境内的多个网格资源分配到多个执行环境。
从第二方面来看,本发明提供一种系统,其用于为网格环境中提交的网格作业,验证特定的执行环境内的资源,包括:网格环境,其包括由网格管理系统管理的多个网格资源;网格服务,其在所述网格环境内由所述网格管理系统支持;所述网格服务进一步包括:用于在所述网格环境内检测特定的执行环境中的新资源的装置,其中所述特定的执行环境包括为处理网格作业而群组的多个网格资源;用于在由所述网格管理系统控制的所述新的资源上运行至少一项功能性测试的装置;以及用于响应于接收所述至少一项功能性测试的结果、在允许将所述网格工作路由到所述新的资源之前、验证所述结果是否符合各期望的结果的装置。
优选地,本发明提供一种系统,其用于验证特定的执行环境内的资源,其中,所述用于在由网格管理系统管理的网格环境内、检测特定的执行环境中的新的资源的装置,进一步包括:用于检测所述新的资源的装置,其中所述新的资源被加到所述执行环境,该执行环境包括之前测试过功能性的多个资源。
优选地,本发明提供一种系统,其用于验证特定的执行环境内的资源,其中,所述用于在由网格管理系统管理的网格环境内、检测特定的执行环境中的新的资源的装置,进一步包括:用于检测所述新的资源的装置,其中所述新的资源被加到所述执行环境,该执行环境包括需要测试功能性的多个附加的资源。
优选地,本发明提供一种系统,其用于验证特定的执行环境内的资源,其中,所述用于在由网格管理系统管理的网格环境内、检测特定的执行环境中的新的资源的装置,进一步包括:用于检测所述新的资源的装置,其中所述新的资源被加到所述执行环境,以替代有缺陷的资源。
优选地,本发明提供一种系统,其用于验证特定的执行环境内的资源,其中,所述用于由网格管理系统控制的所述新资源上运行至少一项功能性测试的装置,进一步包括:用于将测试作业从所述网格管理系统导向所述新的资源的装置;以及用于接收所述测试作业的测试结果的装置。
优选地,本发明提供一种系统,其用于验证特定的执行环境内的资源,其中,所述装置用于由网格管理系统控制的所述新资源上运行至少一项功能性测试,进一步包括:用于调用能够在本地测试所述新资源的诊断工具的装置;以及用于从指示至少一项测试结果的所述诊断工具接收日志文件的装置。
优选地,本发明提供一种系统,其用于验证特定的执行环境内的资源,所述网格服务进一步包括:用于对多个指定的错误条件分析所述结果的装置;以及响应于从所述多个指定的错误条件中检测至少一个错误、用于尝试解决所述至少一个错误的装置;以及用于响应于解决所述错误验证所述结果是否符合所述期望的结果的装置。
优选地,本发明包括一种系统,其用于验证特定的执行环境内的资源,其中,所述网格服务进一步包括:响应于所述错误保持未解决替换所述执行环境中的所述新的资源的装置。
优选地,本发明包括一种系统,其用于验证特定的执行环境内的资源,其中,所述网格服务进一步包括:用于从提交所述网格作业的客户端接收至少一项测试标准的装置;以及响应于允许将所述网格作业路由到所述新的资源、用于当执行所述网格作业时、按所述至少一项测试标准运行所述至少一项功能性测试的装置。
优选地,本发明包括一种系统,其用于验证特定的执行环境内的资源,其中所述网格管理系统管理将所述网格环境内的多个网格资源分配到多个执行环境。
从第三方面来看,本发明包括:计算机程序产品,其可以加载到数字计算机的内部存储器中,该计算机程序产品包括软件代码部分,当所述产品在计算机上运行时,用于执行以实现如上所述的发明。
附图说明
下面参照附图,仅以示例的方式详细描述本发明的各实施例,附图中:
图1描述计算机系统的一个实施例,该计算机系统可以在网格环境中实现,并且本发明可以在该计算机系统中实现;
图2是图示网格环境内的一般类型的各组件的一个实施例的方框图;
图3是描述可以在网格环境中实现的架构的一个示例的方框图;
图4是描述根据本发明的方法、系统和程序、管理网格环境中的多个执行环境的网格管理系统的一个实例的方框图;以及
图5是描述根据本发明的方法、系统和程序的、管理网格环境的网格管理系统的方框图的方框图;
图6是描述根据本发明的方法、系统和程序的、网格验证服务的各组件的示例的方框图的方框图;
图7是描述根据本发明的方法、系统和程序的、测试有效性(availability)表格中的各项的图示例的方框图;
图8是根据本发明的方法、系统和程序的过程和程序的高级逻辑流程图,所述过程和程序用于在网格作业的执行环境中,控制网格作业路由至验证的各资源;以及
图9是根据本发明的方法、系统和程序的过程和程序的高级逻辑流程图,所述过程和程序用于在网格作业提交给各资源之前、对于加至用于网格作业的执行环境的各资源控制资源验证。
具体实施方式
现在参照各附图尤其是图1,描述计算机系统的一个实施例,该计算机系统可以在网格环境中实现,并且本发明可以在该计算机系统中实现。如将进一步描述的,该网格环境包括多个计算机系统,其被管理以提供各资源。此外,如将进一步描述的,本发明可以在各种计算机系统中执行,包括:在网格环境内管理的多个不同操作系统下运行的各种电子设备、移动系统以及计算系统。
在一个实施例中,计算机系统100包括:总线122,或用于在计算机系统100内通信信息的其它设备;以及至少一个处理设备,如处理器112,其耦合至总线122以处理信息。总线122可以包括低延迟和较高延迟的各路径,其由各桥和各适配器连接,并且由多个总线控制器在计算机系统100内控制。当作为服务器系统实现时,计算机系统100典型地包括多个处理器,其被设计以改进网络服务能力。
处理器112可以是通用处理器,如IBM的PowerPCTM处理器,在通常的操作过程中,其在操作系统和应用软件的控制下处理数据,该操作系统和应用软件可从动态存储器件(如随机访问存储器(RAM)114)和静态存储器件(如只读存储器(ROM)116)访问。该操作系统可以提供图形用户接口(GUI)给用户。在一个实施例中,应用软件包含机器可执行的各指令,当其在处理器112上执行时,实现在图8和图9的流程图中描述的各操作,以及这里描述的其他操作。作为替代,本发明的各步骤可由特定的各硬件组件来执行,其包含用于执行各步骤的硬件逻辑,或是由编程的计算机组件和传统硬件组件的任何结合来执行。
本发明可以作为计算机程序产品提供,在其上存储的机器可读介质上包括机器可执行的各指令,所述各指令用于编程计算机系统100以执行根据本发明的处理。这里使用的术语“机器可读介质”包括:参与提供各指令给处理器112、或计算机系统100的其它组件用于执行的任何介质。这样的介质可以采取多种形式,包括但不仅于:非易失性介质、易失性介质以及传输介质。非易失性介质的通常形式包括例如软盘、软磁盘、硬盘、磁带或任何其它磁性介质、致密盘ROM(CD-ROM)或任何其它光介质、穿孔卡片或任何其它具有孔的模式的物理介质、可编程ROM(PROM)、可擦除PROM(EPROM)、电子EPROM(EEPROM)、快闪存储器、任何其它存储器芯片或磁带盒、或计算机系统100可以从其读取并且其适于存储各指令的任何其它介质。在本实施例中,非易失性介质的一个例子是大容量存储设备118,该大容量存储设备118正如所描述的是计算机系统100的内部组件,但将理解也可以由外部设备提供。易失性介质包括如RAM114的动态存储器。传输介质包括同轴电缆、铜线或光纤,包括包含总线122的线。传输介质也可以采取声波或光波的形式,如在无线频率或红外数据通信期间产生的那些波。
此外,本发明被可以下载作为计算机程序产品,其中各程序指令可以通过嵌入在载波或其它传播介质中的各数据信号,经由耦合至总线122的通信接口132的网络链路134(例如调制解调器或网络连接),从远程虚拟资源(如虚拟资源160)传送到请求计算机系统100。虚拟资源160可以包括各资源的虚拟表示,所述各资源可从单个系统或多个系统访问,其中所述多个系统每个都可以被认为是在各独立平台上操作的各资源的各离散集,但是通过网格管理器协同作为虚拟资源。通信接口132提供双向的数据通信,其耦合到可被连接的网络链路134,例如至局域网(LAN)、广域网(WAN)或提供至网络102的访问的网络服务提供商(ISP)。特别地,网络链路134可以提供有线和/或无线网络通信到一个或多个网络,如网络102,通过网络链路134,如在网格环境150内提供的,各虚拟资源(如虚拟资源160)可以访问。网格环境150可以是多种类型的网络的部分,包括点对点网络,或者可以是单个计算机系统的部分,如计算机系统100。
作为一个例子,网络102可以指全世界的网络和网关的集合,其使用特定的协议,如传输控制协议(TCP)和互联网协议(IP)相互通信。网络102使用携带数字数据流的电子、电磁或光信号。通过各种网络的各信号和网络链路134上并通过通信接口132的各信号,是传输信息的各载波的示例性形式,该通信接口132传送数字数据来往计算机系统100。将会理解,可以实现可替换的网络的类型、网络的组合以及网络的基础架构(infrastructure)。
当被实施为服务器系统时,计算机系统100典型地包括多个通信接口,所述多个通信接口经由多个外围组件互连(PCI)总线桥可访问,所述多个外围组件互连(PCI)总线桥连接到输入/输出控制器。在这种方式中,计算机系统100允许连接到多个网络计算机。
此外,尽管没有描述,多个外围组件以及内部/外部设备可以添加到计算机系统100,连接到多个控制器、适配器、以及耦合至总线122的多个层次之一的扩展槽。例如,显示设备、音频设备、键盘或光标控制设备可以添加为外围组件。
本领域的普通技术人员将认识到,图1中描述的硬件可以变化。而且,本领域中的普通技术人员将认识到,根据本发明,描述的例子意图不在于意味对架构的限制。
现在参照图2,方框图图示了网格环境内的普通类型的各组件的一个实施例。在本示例中,网格环境150的各组件包括:客户端系统200,其与网格管理系统240接口,该网格管理系统240与各服务器机群222、各服务器224、各工作站和各台式电脑226、各数据存储系统228以及各网络230接口。为了说明的目的,网格环境150内连接到各组件的网络类型和各网络的位置不做描述。然而将要理解,网格环境150内的各组件可以位于网络基础架构之上,该网络基础架构可以用互相重叠的多种类型的网络实现。网络基础架构范围可以从多个大型企业系统到对单个计算机系统的点对点系统。进一步,将要理解,网格环境150内的各组件仅仅代表网格环境150内的这类组件。网格环境可以简单地被包含在单个计算机系统中或可以包含多个企业系统。此外,将会理解,网格出售者(vendor)可以提供网格环境150,该网格出售者可以例如基于要执行的网格作业需要的时间量、或使用的各资源的实际量,计算网格环境150内使用各资源的成本。
如网格环境150的网格环境的主要目的是组织和分配各资源,所述各资源来自被视为虚拟资源160的多个离散系统。客户端系统200、各服务器机群222、各服务器224、各工作站和各台式电脑226、各数据存储系统228、各网络230以及创建网格管理系统240的各系统可以是异构的,并且随着各独立管理系统区域性地分布,但是通过由网格管理系统240允许的网格基础架构,能够交换信息、各资源和各服务。进一步,各服务器机群222、各服务器224、各工作站和各台式电脑226、各数据存储系统228、以及各网络230,可以跨越各国家和各大陆地理地分布,或者对于彼此本地可访问。将会理解,用于虚拟资源160内的各网格资源的发现的机制在此没有描述,然而,客户端系统200可以发现虚拟资源160内的各资源,如从网格环境150内可获得的局部(local)和全局目录通告(advertise)的。
在本例中,客户端系统200接口网格管理系统240。客户端系统200可以代表向网格管理系统240发送请求的任何计算系统。特别是,客户端200可以发送各虚拟作业请求和各作业到网格管理系统240,并且网格管理系统240可以用网格提供(offer)做出响应,并且控制各网格作业的处理。进一步,尽管在本实施例中,客户端系统200被描述为用请求来访问网格环境150,然而在替代实施例中,客户端200也可以在网格环境150内运行。
尽管虚拟资源160内的各系统被并行地描述,然而实际上,各系统可以是各系统的部分层次,虚拟资源160内的一些系统对客户端系统200来说可以是本地的,而其它系统需要访问外部网络。此外,重要的是注意到,客户端系统200可以物理地包含虚拟资源160内描述的各系统。进一步,虚拟资源160中的各系统可以在各资源节点和各执行环境中分配,这里,资源节点是能够执行特定的网格功能的各资源的群组,而执行环境是能够处理特定的网格作业的各资源节点和各资源的群组。
为了实现网格环境150,网格管理系统240便利各网格服务。各网格服务可以根据多个架构设计,包括但不限于开放网格服务架构(OGSA)。特别地,网格管理系统240指的是,通过将各计算系统链路到异构网络环境创建网格的管理环境,其中异构网络环境具有通过各网格服务共享各资源的特征。
在一个示例中,如将进一步详细介绍的,网格管理系统240可以包括网格服务,其将各资源和各资源节点分配到执行环境,所述执行环境适于进入的网格作业,并且在执行环境内管理各资源和各资源节点,以确保网格作业的性能。此外,网格管理系统可以包括网格服务,所述网格服务在网格作业被路由至分配的资源之前,第一测试和验证分配到执行环境的各网格资源。当检测到错误时,网格服务将尝试解决该错误或替代该资源。
现在参照图3,方框图图示了可以在网格环境中实现的架构的一个示例。如所描述的,架构300包括多个功能性的层。如将进一步描述的,本发明是可以在如架构300的架构的一层或多层中实现的过程,该架构300在如图2中描述的网格环境的网格环境中实现。重要的是注意到,架构300仅仅是可以在网格环境中实现、并且本发明可以在其中实现的架构的一个示例。进一步,重要的是注意到,多个架构可以在网格环境内实现。
在架构300的各层内,首先,物理和逻辑资源层330组织网格中的各系统的各资源。各物理资源包括但不仅限于各服务器、各存储介质以及各网络。各逻辑资源虚拟化并将物理层集合成为各可用的资源,如各操作系统、各处理能力、存储器、I/O处理、各文件系统、各数据库管理器、各目录、各存储器管理器以及其它资源。
其次,web服务层320在网格服务310与物理和逻辑资源330之间提供接口。web服务层320实现各服务接口,所述各服务接口包括但不限于,在因特网协议(IP)或其它网络传输层上执行的可扩展标记语言(XML)、web服务描述语言(WSDL)、以及简单目标访问协议(SOAP)。进一步,开放网格服务基础架构(OGSI)标准322,通过扩展web服务320在当前web服务320之上建立,以提供模型化网格的各资源需要的、动态的以及可管理的web服务的能力。特别是,通过利用web服务320实现OGSI标准322,使用OGSA设计的网格服务310是能互操作的。在替代实施例中,其它基础架构或附加的基础架构可以在web服务层320上实现。
网格服务层310包括多个服务,该服务可以并入到网格管理系统240中。例如,网格服务层310可以包括使用OGSA设计的各网格服务,使得在创建各网格服务中实现统一的标准。作为替代,各网格服务可在多个基础架构下设计。各网格服务可以群组为四个主要功能。然而将会理解,其它功能可以由各网格服务执行。
第一,资源管理服务302管理物理和逻辑资源的使用。各资源可以包括但不仅限于各处理资源、各存储器资源以及各存储资源。这些资源的管理包括调度各作业、分配各作业以及管理各作业的结果的检索(retrieval)。资源管理服务302监视各资源加载并将各作业分配到网格的不太忙的部分,以平衡各资源负载并吸收不期望的活动峰值。特别是,用户可以指定优选的性能级别,使得资源管理服务302分配各作业,以在网格内维持优选的性能级别。
第二,信息服务304管理网格内的各计算系统之间的通信和信息传输。由于可以实现多个通信协议,信息服务304利用多种类型的通信协议,管理跨越多个网络的通信。
第三,数据管理服务306管理网格内的数据传输和存储。特别是,数据管理服务306可以在网格内移动数据到各节点,请求数据的作业将在该网格执行。特定类型的传输协议,如网格文件传输协议(GridFTP)将被实现。
最后,安全服务308应用安全协议,用于在网格内操作的每个系统的各连接层的安全。安全服务308可以实现各安全协议,如开放安全套接层(SSL)以提供安全传输。进一步,安全服务308可以提供单个登陆机制,使得一旦用户被授权,当在网格内为用户执行动作时,就创建和使用代理证书。
多个服务可以工作在一起,以提供网格计算系统的若干关键功能。在第一示例中,各计算的任务在网格内分配。数据管理服务306可以把计算任务分割成各数据分组的单独的各网格服务请求,然后由资源管理服务302分配和管理。各结果由数据管理系统收集和整理(consolidate)。在第二示例中,网格中跨越多个计算系统的各存储资源被视为单个虚拟的数据存储系统,由数据管理服务306管理并由资源管理服务302监视。
应用层340包括各应用程序,该应用程序使用网格服务层310中可得到的一个或多个网格服务。有利的是,应用程序经由网格服务层310和web服务320,与物理和逻辑资源330接口,使得多个异构系统可以交互和互操作。
现在参照图4,描述了根据本发明的方法、系统和程序的、管理网格环境内的多个执行环境的网格管理系统的示例的方框图。如所描述的,网格管理系统(GMS)240管理多个执行环境402和410。在该示例中,每个执行环境402和410包括多个资源,该资源分配用来处理特定的网格作业或一批网格作业。将会理解,GMS240可以物理地包括提供GMS240的功能的多个实例。此外,GMS240可以被分配遍布网格环境150内的多个物理系统,并且可以结合多个网格服务。
根据一个实施例,GMS240建立各网格资源的各执行环境,所述各网格资源能够处理各网格作业,并且为各网格作业提供特定级别的服务质量。GMS240可以建立所有新资源的执行环境,所述新资源是之前还没有被包含在特定的执行环境中的资源。此外,GMS240可以建立执行环境,然后当需要附加的资源时或故障资源需要替换时,添加新的资源。此外,GMS240可以为来自多个不同的客户端的多个网格作业,重新使用执行环境,只要该执行环境符合为每个网格作业的性能和其它要求经协议的规范。
在执行环境内,每个资源可以由本地管理系统控制,该本地管理系统经由网格基础架构与GMS240接口。此外,在执行环境内,各群资源可以由硬件级别管理系统控制,如基于机群的管理系统,其管理遍布群组在机群中的多个服务器系统的负载。将会理解,除了为示例目的描述的各配置之外的各资源的额外配置,可以实现本发明。
在一个示例中,执行环境402包括多个网格资源,该网络资源当被单独来看时,包括硬件平台404、网络适配器406以及操作系统软件408。这些单独的资源可以在多个物理地不同的地点中分配。进一步,这些单独的资源可以是由机群管理工具管理的部分服务器系统的机群。
GMS240也可以管理执行环境410。执行环境410包括硬件平台412、网络适配器414以及操作系统软件416。此外,GMS240将硬件平台404从执行环境402移到执行环境410。
为了说明本发明的优点,当GMS240将硬件平台404分配到执行环境410时,硬件平台404被认为是新的资源,其在允许任何网格作业路由到执行环境410以在硬件平台404上执行之前,需要功能性验证。在一个示例中,GMS240调用操作系统软件416的硬件测试诊断工具430,以请求硬件测试诊断工具430执行硬件平台404的功能性诊断测试。此外,在硬件平台404上执行的操作系统资源可被调用以执行诊断测试。硬件诊断测试工具430可返回日志文件,所述日志文件指示在测试期间发现的任何错误。在另一示例中,GMS240可将测试方程或测试操作导向硬件平台404,并且接收各测试结果,所述各测试结果可与期望的各结果比较,以确定是否存在任何功能性错误。如果检测到功能性错误,那么GMS240可移除该新的资源,并且尝试在执行环境410内替换该资源。
在该示例中,硬件测试诊断工具430被描述为本地的(local)或固有的(native)诊断工具的示例,其可以被调用以在资源级别执行功能性测试,而不是从GMS240执行的测试作业。将会理解,每种类型的资源可以包括本地的、固有的或板上的诊断工具或命令,其可以被调用以在资源级别执行功能性测试。此外,将会理解,操作系统或应用软件可以包括各诊断工具或命令,其可以被调用以在资源级别上执行其它资源的功能性测试。
现在参照图5,描述了根据本发明的方法、系统和程序的、用于管理网格环境的网格管理系统的方框图。在该示例中,GMS240包括多个网格模块,其提供网格服务并存储数据用于遍布网格环境150访问。重要的是注意到,GMS240中描述的各网格模块,可以在网格环境150内的多个网格管理器中分配,并且可以与各资源级别管理工具相互作用。
如所描述的,GMS240包括网格调度器501,用于在网格环境150内检测各进入的作业并调度各进入的作业的执行。特别是,当网格调度器501检测到进入的网格作业时,网格调度器501传递该进入的网格作业给网格分配服务502。
网格分配服务502控制执行环境内的各资源的分配。网格分配服务502可以维持可用的执行环境,可以在各执行环境中移动各资源,还可以建立新的执行环境。在一个实施例中,网格分配服务502可以建立支持一类工作需要的各资源的各资源节点,然后在各执行环境中移动整体资源节点。例如,网格分配服务502可以用支持基于数据库的作业需要的硬件平台、各操作系统资源、各网络连接器资源、各存储子系统以及应用软件,建立资源节点。此外,网格分配服务502可以为其它的网格环境与各网格管理系统通信,以控制来自外部网格环境的另外的资源的访问。
当网格分配服务502在执行环境内分配新的资源时,网格分配服务502在允许作业路由器504将网格作业路由到该新的资源之前,可调用网格验证服务506。在另一实施例中,网格分配服务502在当前网格作业结束时,而在分配该新的资源到新的执行环境之前,可调用网格验证服务506以测试该资源。进一步,在另一实施例中,在网格作业在执行环境中开始后,网格验证服务506可继续测试和验证资源,尤其是,可使用客户端提供的测试标准测试验证该资源。
网格验证服务506确定哪些测试应该在新资源上运行以验证功能性,在新的资源上运行各测试以及分析各测试结果。网格验证服务506返回报告给网格分配服务502,或指出该新资源的已验证的功能性,或指出该新资源内未解决的错误情况。
根据一个实施例,如果网格验证服务506检测到新资源的一个功能性错误,则网格验证服务506利用错误解决的请求,调用网格退化防止服务508。网格退化防止服务508可通过与对新资源本地的错误解决工具通信,或通过执行错误解决安排,尝试解决该新资源中的错误。在一个示例中,如果网格验证服务506检测到CPU的平均利用率超过90%,那么网格验证服务506可调用网格退化防止服务508,因为CPU平均利用率超过90%被认为是错误。然后网格退化防止服务508可启动另一个CPU或激活另一个逻辑划分,以防止性能的进一步恶化。
除了执行各测试以检测错误之外,网格验证服务506可从网格错误监视服务510接收错误指示符。网格错误监视服务510为可以指示环境中的错误的情况,监视网格环境150内的每个执行环境。由网格错误监视服务510报告的错误可以是以错误消息或错误日志的形式。
将会理解,尽管这里描述的服务为网格作业提供自动处理,然而任何描述为网格管理系统240的部分的网格服务,可以由系统管理者通过人为干涉来执行。此外将会理解,网格管理系统240可包括额外的网格服务、作业队列以及存储系统,用于改进处理单独的网格作业的网格管理系统240的效率以及整个网格环境150的效率。
现在参照图6,描述了根据本发明的方法、系统和程序的、网格验证服务的各组件的示例的方框图。如所图示的,网格验证服务506包括测试控制器602。测试控制器602在新资源被加入到执行环境时被初始化。此外,将会理解,测试控制器602响应于网格环境内的其它事件可被初始化。
当测试控制器602初始化时,测试控制器602为新资源的应用测试搜索可用的测试表格604。如将参照图7进一步详细描述的,可用的测试表格604包括根据资源类型以及由资源类进一步指定的各测试。此外,可用的测试表格604既包括调用各本地资源测试的各测试,又包括要由测试控制器602运行的各测试作业。除了访问可用的测试表格604之外,测试控制器602可询问各新资源以确定该资源是否包括本地诊断工具,该本地诊断工具可以被调用以允许该新资源自检。
测试控制器602在测试结果表格606中收集各测试结果。测试结果表格606可包括日志文件数据和直接测试结果,根据新资源组织。
一旦测试控制器602完成新资源的测试,错误检测器610就分析测试结果表格606以发现错误。特别是,错误检测器610可为错误条件搜索各日志文件。此外,错误检测器610可比较来自测试控制器601执行的各测试的测试结果和期望的各结果,并且检测其结果不符合期望的错误。
然后,当确定如何响应已检测的错误时,错误检测器610访问可接受的错误表格608。可接受的错误表格608包括错误的条件,其在特定的执行环境内或网格环境内是可以接受的。例如,检测的磁盘子系统的日志文件可指示各坏的块的重分配,然而,磁盘子系统上各坏的块的重分配在可接受的错误表格608中被指明,作为磁盘控制器的普通功能。
错误检测器610可以利用用于网格退化防止服务508的请求来调用网格退化防止服务508,以尝试解决检测到的错误,。在一个示例中,网格退化防止服务508能够解决检测到的错误,并返回错误解决报告给错误检测器610。在另一个示例中,网格退化防止服务508未能解决检测到的错误,并返回错误没有解决的指示符。然后错误检测器610通知网格分配服务502,是否存在任何未解决的错误或是否所有新资源已验证。
现在参照图7,图示了根据本发明的方法、系统和程序的、测试可靠性表格中的各条目的图例。如所描述的,可用的测试表格604包括根据普通类型的资源、以及根据各资源的类进一步指定的各测试。此外,各测试可以通过资源名称来为每个特定的资源指定。将会理解,可用的测试表格604中描述的各测试是各测试类型的示例,该测试可被执行以及调用,并且实际的测试顺序,可根据验证网格资源的功能性所需要的测试的准确度来调整。
当资源是处理器时,可用的测试表格604指定多个可用的测试和预期的结果类型,如参考标号702所图示的。在第一示例中,处理器可通过调用本地的处理器诊断来测试,该本地处理器诊断可从操作系统调用;可用的测试表格604可包括用于基于多类操作系统的处理器诊断的调用引用。本地处理器诊断可返回日志文件。在第二个示例中,处理器可通过用测试方程的集合运行测试作业并且收集各测试结果来测试。多个测试方程的集合可以根据处理器或各处理器的类型可得到并且被指定。在任一示例中,包括总线和底板的各处理器可被测试,并且验证各结果。
当资源是存储器时,可用的测试表格604指明多个可用的测试和期望的结果类型,如参考标号704所图示的。在第一示例中,存储器可通过调用基于本地的操作系统的存储器诊断工具来测试;可用的测试表格604可包括命令引用,用于基于多种类型操作系统的存储器诊断。在第二示例中,存储器可通过在存储器上运行位检查测试的测试作业来测试;收集各测试结果用于与期望的位模式比较。在第三示例中,存储器可通过运行完整模式的读写测试来测试,所述完整模式的读写测试设计用来验证存储器功能;收集各测试结果,用于确定是否读写被正确执行。在一个示例中,测试控制器602可为较快的存储器资源选择完整模式读写测试,而为较慢的存储器资源选择位检查测试。
当资源是网络适配器时,可用的测试表格604使得多个测试可用并且按网络适配器的类存储,如参考标号706所图示的。网络适配器的各类可以包括但不限于SAN适配器和IP适配器。对每类网络适配器可以执行一系列的测试。第一,在该系列中,测试控制器602贯注于调用板上回送测试。特别是,网络适配器可以包括板上诊断,其可以被其它系统通过命令调用来调用。第二,在该系列中,测试控制器602贯注于运行连接性测试。在一个示例中,如ping(因特网探测分组)测试的连接性测试可被使用,其中结果的“ping”是期望的。将会理解,可指定额外的各测试,以测试单独的网络适配器和各类的网络适配器的功能性。
当资源是设备控制器(如SCSI设备控制器)时,可用的测试表格604使得多种测试可用并按设备控制器的类存储,如参考标号708所图示的。对每类设备控制器可执行一系列的测试。第一,在该系列中,测试控制器602贯注于调用板上回送测试以测试本地硬件。第二,在该系列中,测试控制器602贯注于执行测试硬件访问的测试作业。测试访问通常包括各指令,其启用设备控制器的读写能力、各适配器、以及各路径的验证。例如,如果设备控制器是磁盘子系统,则该测试访问可包括各指令,以用预定的数据模式在每个磁盘上写文件,读回每个文件,然后删除每个文件。
当资源是存储子系统(如磁盘或磁带)时,可用的测试表格604使得多个测试可用并按存储子系统的类存储,如参考标号710所图示的。对于每一类存储子系统,可执行特定的测试访问。在介质是不可移动的情况下,该测试可以包括各指令,以验证该存储子系统的每个部分。作为替代,在介质是可以移动的情况下,该测试可包括各指令,以验证整个存储子系统的读写能力和各路径。进一步,如果存储子系统包括板上诊断工具,则可用的测试表格604可以包括用于板上诊断工具的调用操作。
当资源是操作系统软件时,可用的测试表格604根据操作系统的类型,使得多个测试可用,如参考标号712所图示的。对于每种类型的操作系统,该测试包括调用操作系统工具的各指令,用于参数测试和准备就绪测试。特别是,每种操作系统可以包括各诊断工具,其可以被调用以验证该操作系统。在一个示例中,该测试可以包括各指令,以在AIX操作系统(AIX是国际商用机器公司的注册商标)内调用各工具。特别是,参照AIX操作系统,“lppchk-v”指令可以被调用来测试以确保没有软件部分矛盾存在;“oslevel-r”指令可以被调用以请求操作系统发布(release)级别以及维护级别;“instfix-ik”指令可以被调用以验证:所有的文件组已展现给当前发布和维护级别;“lslpp-L”指令可以被调用并与过滤器(filter)一起使用,所述过滤器指定请求哪个结果,以确定任何特定的操作系统文件组或设备驱动器的存在和状态;以及“set”指令可以被调用并与过滤器一起使用,以确定需要的各环境变量的存在和值。将会理解,额外的各AIX操作系统指令可以被调用以测试AIX操作系统的各参数和准备就绪。此外,将会理解,其它类型的指令可以被指定,以为其它操作系统调用。
当资源是应用软件时,可用的测试表格604根据软件的类型使得多个测试可用,如参考标号714所图示的。如果应用软件包括自验证安排,可用的测试表格604可以包括特定的调用用于自验证安排。作为替代,可用的测试表格604可以包括指令,以为当前应用的特定类运行功能性测试作业。在一个示例中,该应用软件资源是DB2数据库软件(DB2是国际商用机器公司的注册商标),其在数据库软件类中。数据库类功能性测试作业将需要以下操作的性能:(1)验证正确的后台程序和过程正在进行;(2)连接至数据库并验证与数据库的连接;(3)在数据库中创建测试表格;(4)组装(populate)测试数据到表格中;(5)针对该表格用已知的各结果执行询问,并验证各结果;(6)删除测试表格;(7)从数据库断开连接;以及(8)移除数据库别名。将会理解,可调用测试和验证数据库软件的额外操作。此外将会理解,可用的测试表格604用各结果和各结果类型图示了示例测试情形,然而,本领域的技术人员可将这些示例测试情形扩展到额外的或更合适的平台和应用。
现在参照图8,描述了根据本发明的方法、系统和程序的流程和程序的高层逻辑流程图,所述流程和程序用于为所述网格作业控制将网格作业路由到执行环境中验证过的各资源。如图示的,流程开始于块800,接下来进行到块802。块802描述了接收新网格作业的网格调度器。接下来,块804描述网格调度器,其通知网格分配服务关于该新网格作业。之后,块806描述网格分配服务,其将为该新网格作业需要的各资源组合到为新的网格作业的执行环境中。接下来,块808描述网格分配服务,其初始化该网格验证服务,以在执行环境中验证各新资源,并且流程传递到块810。
块810描述判断:网格分配服务是否接收到资源功能性已被验证的指示符。如果该资源功能性已被验证,则流程传递到块812。块812描述网格分配服务,其通知网格工作路由器,将该作业路由到该执行环境内的各资源或替代资源,并且过程结束。否则在块810,如果资源功能性没有被验证,那么过程传递到块814。块814描述网格分配服务位置替换资源,并在执行环境内替换非功能性资源;然后过程返回到块808。
现在参照图9,描述了根据本发明的方法、系统和程序的过程和程序的高层逻辑流程图,用于在网格作业提交给各资源之前、为各资源控制资源验证,所述各资源为网格作业添加到执行环境。如图示的,过程开始于块900,接下来进行到块902。块902描述判断:网格验证服务是否接收到来自网格分配服务的验证新资源的请求。如果接收到验证新资源的请求,那么过程传递到块904。块904描述为来自测试可用性表格的各新资源选择各测试。接下来,块906描述在新资源上运行选择的各测试,并且过程传递到块908。
块908描述为每个新资源收集测试结果表格里的各测试结果。块910描述判断:是否响应所有运行测试接收各结果。如果所有的结果仍未被接收,那么过程返回到决908。一旦所有的结果被接收,那么过程传递到块912。
块912描述判断:在各结果中是否检测到任何错误。如果没有检测到错误,那么该过程传递到块920。块920描述通知网格分配服务:资源的功能性被验证,然后过程结束。否则,在块918如果检测到错误,那么过程传递到块916。
块916描述提交该错误到资源退化防止服务。资源退化防止服务尝试解决该错误。如果资源退化防止服务不能解决该错误,那么过程传递到块922。块922描述通知网格分配服务关于该资源错误,并且过程结束。否则,在块918,如果资源退化防止服务能够解决该错误,那么过程传递到块920。

Claims (21)

1.一种方法,用于为网格环境里提交的网格作业,验证特定的执行环境内的资源,其包括:
在由网格管理系统管理的网格环境内,检测特定的执行环境中的新资源,其中所述特定的执行环境包括为处理网格作业而群组的多个网格资源;
在由所述网格管理系统控制的所述新资源上运行至少一项功能性测试;以及
响应于接收所述至少一项功能性测试的结果,在允许将所述网格作业路由到所述新资源之前,验证所述结果是否符合各期望的结果,使得在允许访问所述新资源之前,所述新资源的功能性被自动地验证。
2.根据权利要求1所述的、用于验证特定的执行环境内的资源的方法,其中在由网格管理系统管理的网格环境内,检测特定的执行环境中的新资源,进一步包括:
检测所述新资源,其中所述新资源被添加到所述执行环境,所述执行环境包括之前测试过功能性的多个资源。
3.根据权利要求1所述的、用于验证特定的执行环境内的资源的方法,其中在由网格管理系统管理的网格环境内,检测特定的执行环境中的新资源,进一步包括:
检测所述新资源,其中所述新资源被添加到所述执行环境,所述执行环境包括需要测试功能性的多个附加的资源。
4.根据权利要求1所述的、用于验证特定的执行环境内的资源的方法,其中在由网格管理系统管理的网格环境内,检测特定的执行环境中的新资源,进一步包括:
检测所述新资源,其中所述新资源被添加到所述执行环境以替代有缺陷的资源。
5.根据权利要求1所述的、用于验证特定的执行环境内的资源的方法,其中在由所述网格管理系统控制的所述新资源上运行至少一项功能性测试,进一步包括:
从所述网格管理系统将测试作业导向所述新资源;以及
接收所述测试作业的测试结果。
6.根据权利要求1所述的、用于验证特定的执行环境内的资源的方法,其中在由所述网格管理系统控制的所述新资源上运行至少一项功能性测试,进一步包括:
调用诊断工具,其能够在本地测试所述新资源;以及
从所述诊断工具接收日志文件,其指示至少一项测试结果。
7.根据权利要求1所述的、用于验证特定的执行环境内的资源的方法,进一步包括:
为多个指定的错误条件分析所述结果;以及
响应于从所述多个指定的错误条件中检测至少一个错误,尝试解决所述至少一个错误;以及
响应于解决所述错误,验证所述结果是否符合所述期望的结果。
8.根据权利要求7所述的、用于验证特定的执行环境内的资源的方法,进一步包括:
响应于所述错误保持未解决,替换所述执行环境内的所述新资源。
9.根据权利要求7所述的、用于验证特定的执行环境内的资源的方法,进一步包括:
从提交所述网格作业的客户端,接收至少一项测试标准;以及
响应于允许将所述网格作业路由到所述新资源,在所述网格作业执行时,用所述至少一项测试标准运行所述至少一项功能性测试。
10.根据权利要求1所述的、用于验证特定的执行环境内的资源的方法,其中所述网格管理系统管理将所述网格环境内的多个网格资源分配到多个执行环境。
11.一种系统,用于为网格环境中提交的网格作业,验证特定的执行环境内的资源,其包括:
网格环境,其包括由网格管理系统管理的多个网格资源;
网格服务,其在所述网格环境内由所述网格管理系统支持;
所述网格服务进一步包括:
用于在所述网格环境中检测特定的执行环境内的新资源的装置,其中所述特定的执行环境包括为处理网格作业而群组的多个网格资源;
用于在由所述网格管理系统控制的所述新资源上运行至少一项功能性测试的装置;以及
用于响应于接收所述至少一项功能性测试的结果、在允许将所述网格作业路由到所述新资源之前、验证所述结果是否符合各期望的结果的装置。
12.根据权利要求11所述的、用于验证特定的执行环境内的资源的系统,其中所述用于在由网格管理系统管理的网格环境内、检测特定的执行环境中的新资源的装置,进一步包括:
用于检测所述新资源的装置,其中所述新资源被添加到所述执行环境,所述执行环境包括之前测试过功能性的多个资源。
13.根据权利要求11所述的、用于验证特定的执行环境内的资源的系统,其中所述用于在由网格管理系统管理的网格环境内、检测特定的执行环境中的新资源的装置,进一步包括:
用于检测所述新资源的装置,其中所述新资源被添加到所述执行环境,所述执行环境包括需要测试功能性的多个附加的资源。
14.根据权利要求11所述的、用于验证特定的执行环境内的资源的系统,其中所述用于在由网格管理系统管理的网格环境内、检测特定的执行环境中的资源的装置,进一步包括:
用于检测所述新资源的装置,其中所述新资源被添加到所述执行环境以替代有缺陷的资源。
15.根据权利要求11所述的、用于验证特定的执行环境内的资源的系统,其中所述用于在由所述网格管理系统控制的所述新资源上运行至少一项功能性测试的装置,进一步包括:
用于从所述网格管理系统将测试作业导向所述新资源的装置;以及
用于接收所述测试作业的测试结果的装置。
16.根据权利要求11所述的、用于验证特定的执行环境内的资源的系统,其中所述用于在由所述网格管理系统控制的所述新资源上运行至少一项功能性测试的装置,进一步包括:
用于调用能够在本地测试所述新资源的诊断工具的装置;以及
用于从指示至少一项测试结果的所述诊断工具接收日志文件的装置。
17.根据权利要求11所述的、用于验证特定的执行环境内的资源的系统,所述网格服务进一步包括:
用于对多个指定的错误条件分析所述结果的装置;以及
用于响应于从所述多个指定的错误条件中检测至少一个错误、尝试解决所述至少一个错误的装置;以及
用于响应于解决所述错误验证所述结果是否符合所述期望的结果的装置。
18.根据权利要求17所述的、用于验证特定的执行环境内的资源的系统,所述网格服务进一步包括:
用于响应于所述错误保持未解决替换所述执行环境里的所述新资源的装置。
19.根据权利要求17所述的、用于验证特定的执行环境内的资源的系统,所述网格服务进一步包括:
用于从提交所述网格作业的客户端接收至少一项测试标准的装置;以及
用于响应于允许将所述网格作业路由到所述新资源、在所述网格作业执行时、用所述至少一项测试标准运行所述至少一项功能性测试的装置。
20.根据权利要求11所述的、用于验证特定的执行环境内的资源的系统,其中所述网格管理系统管理将所述网格环境内的多个网格资源分配到多个执行环境。
21.一种计算机程序产品,其可以加载到数字计算机的内部存储器中,包括软件代码部分,当所述产品在计算机上运行时,用于执行以实现根据权利要求1到权利要求11所述的发明。
CN200580046126A 2005-01-06 2005-12-19 提交给网格环境的网格作业使用前的资源功能性验证 Expired - Fee Related CN100578455C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/031,427 US7502850B2 (en) 2005-01-06 2005-01-06 Verifying resource functionality before use by a grid job submitted to a grid environment
US11/031,427 2005-01-06

Publications (2)

Publication Number Publication Date
CN101099132A true CN101099132A (zh) 2008-01-02
CN100578455C CN100578455C (zh) 2010-01-06

Family

ID=36097116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580046126A Expired - Fee Related CN100578455C (zh) 2005-01-06 2005-12-19 提交给网格环境的网格作业使用前的资源功能性验证

Country Status (5)

Country Link
US (2) US7502850B2 (zh)
EP (1) EP1839145A1 (zh)
JP (1) JP2008527513A (zh)
CN (1) CN100578455C (zh)
WO (1) WO2006072546A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102209134A (zh) * 2010-03-30 2011-10-05 深圳富泰宏精密工业有限公司 自动撷取日志的系统及方法
CN102591771A (zh) * 2010-11-18 2012-07-18 国际商业机器公司 关于对访问请求的意外响应验证计算机程序的方法和装置
CN105579965A (zh) * 2013-09-23 2016-05-11 亚马逊科技公司 经由提供商定义接口的客户端驻地资源控制

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7562143B2 (en) 2004-01-13 2009-07-14 International Business Machines Corporation Managing escalating resource needs within a grid environment
US7406691B2 (en) 2004-01-13 2008-07-29 International Business Machines Corporation Minimizing complex decisions to allocate additional resources to a job submitted to a grid environment
US7552437B2 (en) 2004-01-14 2009-06-23 International Business Machines Corporation Maintaining application operations within a suboptimal grid environment
US7266547B2 (en) 2004-06-10 2007-09-04 International Business Machines Corporation Query meaning determination through a grid service
US7590623B2 (en) 2005-01-06 2009-09-15 International Business Machines Corporation Automated management of software images for efficient resource node building within a grid environment
US7562035B2 (en) 2005-01-12 2009-07-14 International Business Machines Corporation Automating responses by grid providers to bid requests indicating criteria for a grid job
US7814492B1 (en) * 2005-04-08 2010-10-12 Apple Inc. System for managing resources partitions having resource and partition definitions, and assigning a named job to an associated partition queue
US20080022155A1 (en) * 2006-07-20 2008-01-24 International Business Machines Corporation Facilitating testing of file systems by minimizing resources needed for testing
US8108864B2 (en) * 2007-06-01 2012-01-31 International Business Machines Corporation Method and system for dynamically tracking arbitrary task dependencies on computers in a grid environment
US20090055466A1 (en) * 2007-08-23 2009-02-26 Prima Grid Ltd. Grid-based system for providing business services in data networks
CN102546300B (zh) * 2007-12-29 2015-02-04 中国移动通信集团公司 测试系统及操作域设备
US20100281095A1 (en) * 2009-04-21 2010-11-04 Wehner Camille B Mobile grid computing
US9317407B2 (en) * 2010-03-19 2016-04-19 Novell, Inc. Techniques for validating services for deployment in an intelligent workload management system
US8965801B2 (en) 2010-03-31 2015-02-24 International Business Machines Corporation Provision of support services as a service
US20120011440A1 (en) * 2010-05-13 2012-01-12 Theresa Kinney-Johnson Method for Online Grid Associations
US8615585B2 (en) 2010-05-28 2013-12-24 International Business Machines Corporation Ontology based resource provisioning and management for services
US8700777B2 (en) 2010-05-28 2014-04-15 International Business Machines Corporation Extensible support system for service offerings
US20120102007A1 (en) * 2010-10-22 2012-04-26 Alpine Consulting, Inc. Managing etl jobs
US8661296B2 (en) * 2011-01-31 2014-02-25 International Business Machines Corporation Dynamic data store for failed jobs in a systems complex
US9385964B2 (en) 2011-04-01 2016-07-05 Hitachi, Ltd. Resource management method and management server
US9928483B2 (en) * 2011-04-20 2018-03-27 Level 3 Communication, Llc Automated topology change detection and policy based provisioning and remediation in information technology systems
US9124640B2 (en) 2011-08-09 2015-09-01 CloudPassage, Inc. Systems and methods for implementing computer security
US8412945B2 (en) 2011-08-09 2013-04-02 CloudPassage, Inc. Systems and methods for implementing security in a cloud computing environment
US9497224B2 (en) 2011-08-09 2016-11-15 CloudPassage, Inc. Systems and methods for implementing computer security
US9086929B2 (en) 2012-04-06 2015-07-21 International Business Machines Corporation Dynamic allocation of a workload across a plurality of clouds
US9071613B2 (en) 2012-04-06 2015-06-30 International Business Machines Corporation Dynamic allocation of workload deployment units across a plurality of clouds
US9477529B2 (en) 2012-06-20 2016-10-25 International Business Machines Corporation Job distributed within a grid environment using mega-host groupings of execution hosts based on resource attributes
CN105760292B (zh) * 2014-12-18 2019-01-08 阿里巴巴集团控股有限公司 一种用于单元测试的断言验证方法和装置
US10361945B2 (en) 2015-10-08 2019-07-23 Fluke Corporation System and method to reconcile cabling test results with cabling test configurations
US10367713B2 (en) 2015-10-15 2019-07-30 Fluke Corporation Cloud based system and method for managing testing configurations for cable test devices
US20170123873A1 (en) * 2015-10-29 2017-05-04 Saudi Arabian Oil Company Computing hardware health check
US20170180372A1 (en) * 2015-12-16 2017-06-22 Fluke Corporation Project documentation sharing and collaboration in a cloud-based environment
US10097443B2 (en) 2015-12-16 2018-10-09 Fluke Corporation System and method for secure communications between a computer test tool and a cloud-based server
US10389594B2 (en) * 2017-03-16 2019-08-20 Cisco Technology, Inc. Assuring policy impact before application of policy on current flowing traffic

Family Cites Families (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US645692A (en) * 1899-11-14 1900-03-20 Samuel Richardson Pipe-union.
US4591980A (en) * 1984-02-16 1986-05-27 Xerox Corporation Adaptive self-repairing processor array
US5220674A (en) * 1987-07-17 1993-06-15 Digital Equipment Corporation Local area print server for requesting and storing required resource data and forwarding printer status message to selected destination
US6389010B1 (en) * 1995-10-05 2002-05-14 Intermec Ip Corp. Hierarchical data collection network supporting packetized voice communications among wireless terminals and telephones
WO1992005485A2 (en) * 1990-09-17 1992-04-02 Cabletron Systems, Inc. Network management system using model-based intelligence
US5325525A (en) * 1991-04-04 1994-06-28 Hewlett-Packard Company Method of automatically controlling the allocation of resources of a parallel processor computer system by calculating a minimum execution time of a task and scheduling subtasks against resources to execute the task in the minimum time
FR2698461B1 (fr) * 1992-11-23 1995-01-13 Bull Sa Dispositif de traitement de l'information permettant la gestion d'une ressource informatique par un système d'administration.
US5416840A (en) * 1993-07-06 1995-05-16 Phoenix Technologies, Ltd. Software catalog encoding method and system
FR2711436B1 (fr) * 1993-10-18 1996-01-05 France Telecom Procédé perfectionné de fonctionnement en parallèle de plusieurs unités de calcul, notamment en traitement d'images, et architecture correspondante.
US5640569A (en) * 1995-04-28 1997-06-17 Sun Microsystems, Inc. Diverse goods arbitration system and method for allocating resources in a distributed computer system
US5978583A (en) * 1995-08-07 1999-11-02 International Business Machines Corp. Method for resource control in parallel environments using program organization and run-time support
US5905975A (en) * 1996-01-04 1999-05-18 Ausubel; Lawrence M. Computer implemented methods and apparatus for auctions
EP0790559B1 (en) 1996-02-14 2002-05-15 Hitachi, Ltd. Method of monitoring a computer system, featuring performance data distribution to plural monitoring processes
US5729472A (en) 1996-05-17 1998-03-17 International Business Machines Corporation Monitoring architecture
US6552813B2 (en) * 1996-06-11 2003-04-22 Sun Microsystems, Inc. Directing print jobs in a network printing system
AU3567997A (en) * 1996-07-05 1998-02-02 Paulo Correa Controller-based radio frequency amplifier module and method
US6064810A (en) * 1996-09-27 2000-05-16 Southern Methodist University System and method for predicting the behavior of a component
US5884046A (en) * 1996-10-23 1999-03-16 Pluris, Inc. Apparatus and method for sharing data and routing messages between a plurality of workstations in a local area network
US6452692B1 (en) * 1996-12-02 2002-09-17 Sun Microsystems, Inc. Networked printer server
US6067580A (en) * 1997-03-11 2000-05-23 International Business Machines Corporation Integrating distributed computing environment remote procedure calls with an advisory work load manager
US6119186A (en) * 1997-05-30 2000-09-12 Texas Instruments Incorporated Computer system with environmental manager for detecting and responding to changing environmental conditions
US6003075A (en) * 1997-07-07 1999-12-14 International Business Machines Corporation Enqueuing a configuration change in a network cluster and restore a prior configuration in a back up storage in reverse sequence ordered
US6915265B1 (en) * 1997-10-29 2005-07-05 Janice Johnson Method and system for consolidating and distributing information
US6310889B1 (en) * 1998-03-12 2001-10-30 Nortel Networks Limited Method of servicing data access requests from users
JP3065053B2 (ja) * 1998-01-06 2000-07-12 セイコーエプソン株式会社 機器監視システム、ローカル監視装置、統合監視装置、機器監視方法、及び、プログラムを格納したコンピュータ可読媒体
US6154787A (en) * 1998-01-21 2000-11-28 Unisys Corporation Grouping shared resources into one or more pools and automatically re-assigning shared resources from where they are not currently needed to where they are needed
US6185598B1 (en) * 1998-02-10 2001-02-06 Digital Island, Inc. Optimized network resource location
JP3884862B2 (ja) * 1998-04-30 2007-02-21 キヤノン株式会社 データ転送装置、データ転送装置の制御方法、記憶媒体
US6324656B1 (en) * 1998-06-30 2001-11-27 Cisco Technology, Inc. System and method for rules-driven multi-phase network vulnerability assessment
US6606602B1 (en) * 1998-07-20 2003-08-12 Usa Technologies, Inc. Vending machine control system having access to the internet for the purposes of transacting e-mail, e-commerce, and e-business, and for conducting vending transactions
US6717694B1 (en) * 1998-07-31 2004-04-06 Canon Kabushiki Kaisha Data transmission apparatus, system and method, and recording medium
US6167445A (en) * 1998-10-26 2000-12-26 Cisco Technology, Inc. Method and apparatus for defining and implementing high-level quality of service policies in computer networks
US6625643B1 (en) * 1998-11-13 2003-09-23 Akamai Technologies, Inc. System and method for resource management on a data network
US7451106B1 (en) * 1998-11-30 2008-11-11 E-Lynxx Corporation System and method for competitive pricing and procurement of customized goods and services
US6647373B1 (en) * 1998-12-24 2003-11-11 John Carlton-Foss Method and system for processing and transmitting electronic reverse auction information
US6418462B1 (en) * 1999-01-07 2002-07-09 Yongyong Xu Global sideband service distributed computing method
US20040095237A1 (en) * 1999-01-09 2004-05-20 Chen Kimball C. Electronic message delivery system utilizable in the monitoring and control of remote equipment and method of same
US6748416B2 (en) * 1999-01-20 2004-06-08 International Business Machines Corporation Client-side method and apparatus for improving the availability and performance of network mediated services
US6370565B1 (en) * 1999-03-01 2002-04-09 Sony Corporation Of Japan Method of sharing computation load within a distributed virtual environment system
US6438704B1 (en) * 1999-03-25 2002-08-20 International Business Machines Corporation System and method for scheduling use of system resources among a plurality of limited users
US6560609B1 (en) * 1999-06-14 2003-05-06 International Business Machines Corporation Delegating instance management functions to underlying resource managers
US6463454B1 (en) * 1999-06-17 2002-10-08 International Business Machines Corporation System and method for integrated load distribution and resource management on internet environment
US6480955B1 (en) * 1999-07-09 2002-11-12 Lsi Logic Corporation Methods and apparatus for committing configuration changes to managed devices prior to completion of the configuration change
US6564377B1 (en) * 1999-07-26 2003-05-13 Microsoft Corporation Self-describing components within a software catalog
US6597956B1 (en) * 1999-08-23 2003-07-22 Terraspring, Inc. Method and apparatus for controlling an extensible computing system
US6356909B1 (en) * 1999-08-23 2002-03-12 Proposal Technologies Network, Inc. Web based system for managing request for proposal and responses
US6453376B1 (en) * 1999-10-21 2002-09-17 Sony Corporation Method for implementing scheduling mechanisms with selectable resource modes
US6470384B1 (en) * 1999-10-28 2002-10-22 Networks Associates, Inc. Modular framework for configuring action sets for use in dynamically processing network events in a distributed computing environment
US6714987B1 (en) * 1999-11-05 2004-03-30 Nortel Networks Limited Architecture for an IP centric distributed network
US6546387B1 (en) * 1999-11-15 2003-04-08 Transcom Software Inc. Computer network information management system and method using intelligent software agents
US6681251B1 (en) 1999-11-18 2004-01-20 International Business Machines Corporation Workload balancing in clustered application servers
FR2801697B1 (fr) * 1999-11-26 2002-01-25 Bull Sa Procede d'acces selon divers protocoles a des objets d'un arbre representatif d'au moins une ressource de systeme
US6567935B1 (en) 1999-12-22 2003-05-20 Qwest Communications International Inc. Performance linking methodologies
US6597935B2 (en) * 2000-02-10 2003-07-22 The Johns Hopkins University Method for harmonic phase magnetic resonance imaging
US7146233B2 (en) * 2000-02-11 2006-12-05 Sun Microsystems, Inc. Request queue management
US6735200B1 (en) * 2000-03-21 2004-05-11 International Business Machines Corporation Method and apparatus for monitoring the availability of nodes in a communications network
US6671676B1 (en) * 2000-05-04 2003-12-30 Metreo Markets, Inc. Method and apparatus for analyzing and allocating resources of time-varying value using recursive lookahead
US7051098B2 (en) * 2000-05-25 2006-05-23 United States Of America As Represented By The Secretary Of The Navy System for monitoring and reporting performance of hosts and applications and selectively configuring applications in a resource managed system
US6578160B1 (en) * 2000-05-26 2003-06-10 Emc Corp Hopkinton Fault tolerant, low latency system resource with high level logging of system resource transactions and cross-server mirrored high level logging of system resource transactions
US7080077B2 (en) * 2000-07-10 2006-07-18 Oracle International Corporation Localized access
US6816905B1 (en) * 2000-11-10 2004-11-09 Galactic Computing Corporation Bvi/Bc Method and system for providing dynamic hosted service management across disparate accounts/sites
JP2002200828A (ja) * 2000-10-23 2002-07-16 Canon Inc 情報処理装置、制御方法及び記憶媒体
US7027412B2 (en) * 2000-11-10 2006-04-11 Veritas Operating Corporation System for dynamic provisioning of secure, scalable, and extensible networked computer environments
US20040213220A1 (en) * 2000-12-28 2004-10-28 Davis Arlin R. Method and device for LAN emulation over infiniband fabrics
US20020103904A1 (en) * 2001-01-31 2002-08-01 Hay Russel C. Method and apparatus for controlling access to files associated with a virtual server
US20020116488A1 (en) * 2001-02-09 2002-08-22 Subramanian Harihara Rama System and method for delivery and usage based billing for data services in telecommunication networks
JP2002307783A (ja) * 2001-04-10 2002-10-23 Seiko Epson Corp プリンタ、posシステム、無線通信制御方法および情報記録媒体
US6832248B1 (en) * 2001-05-10 2004-12-14 Agami Systems, Inc. System and method for managing usage quotas
US20020171864A1 (en) * 2001-05-16 2002-11-21 Robert Sesek Methods and apparatus for printing around a job in a printer queue
FI110976B (fi) 2001-06-15 2003-04-30 Wts Wireless Technology System Menetelmä ja järjestelmä palvelujen ja laitteiden hallitsemiseksi tietoverkossa
US7113299B2 (en) * 2001-07-12 2006-09-26 Canon Development Americas, Inc. Printing with credit card as identification
US6823382B2 (en) 2001-08-20 2004-11-23 Altaworks Corporation Monitoring and control engine for multi-tiered service-level management of distributed web-application servers
US20030041010A1 (en) * 2001-08-23 2003-02-27 Mark Yonao-Cowan Online bidding for contracts
US7230949B2 (en) * 2001-08-24 2007-06-12 Juniper Networks, Inc. Efficient method and system for automatic discovery and verification of optimal paths through a dynamic multi-point meshed overlay network
US20030115099A1 (en) * 2001-11-01 2003-06-19 Burns Stanley S. Method of automated online media planning and buying
US7222190B2 (en) * 2001-11-02 2007-05-22 Internap Network Services Corporation System and method to provide routing control of information over data networks
EP1320217B1 (en) * 2001-12-14 2004-10-13 Hewlett-Packard Company, A Delaware Corporation Method of installing monitoring agents, system and computer program for monitoring objects in an IT network
US7093259B2 (en) * 2001-12-20 2006-08-15 Cadence Design Systems, Inc. Hierarchically structured logging for computer work processing
US7356592B2 (en) * 2002-01-24 2008-04-08 International Business Machines Corporation Method and apparatus for web farm traffic control
US20030145084A1 (en) * 2002-01-25 2003-07-31 Mcnerney Shaun Charles System and method for decentralized system and network performance assessment and verification
US7103628B2 (en) * 2002-06-20 2006-09-05 Jp Morgan Chase & Co. System and method for dividing computations
US7324969B2 (en) * 2002-04-11 2008-01-29 Intel Corporation System and method for automated auctioning of web services
US7010596B2 (en) * 2002-06-28 2006-03-07 International Business Machines Corporation System and method for the allocation of grid computing to network workstations
JP4133068B2 (ja) * 2002-07-23 2008-08-13 株式会社日立製作所 計算機システム
US6963285B2 (en) * 2002-09-30 2005-11-08 Basic Resources, Inc. Outage notification device and method
US7200657B2 (en) * 2002-10-01 2007-04-03 International Business Machines Corporation Autonomic provisioning of network-accessible service behaviors within a federated grid infrastructure
US20040078471A1 (en) * 2002-10-18 2004-04-22 Collatus Corporation, A Delaware Corportion Apparatus, method, and computer program product for building virtual networks
US20040098606A1 (en) * 2002-11-18 2004-05-20 International Business Machines Corporation System, method and program product for operating a grid of service providers based on a service policy
US7055052B2 (en) * 2002-11-21 2006-05-30 International Business Machines Corporation Self healing grid architecture for decentralized component-based systems
US7243147B2 (en) * 2002-12-30 2007-07-10 Bellsouth Ip Corporation Systems and methods for the detection and management of network assets
US7930158B2 (en) * 2003-03-31 2011-04-19 Emc Corporation Method and apparatus for multi-realm system modeling
US7644408B2 (en) * 2003-04-25 2010-01-05 Spotware Technologies, Inc. System for assigning and monitoring grid jobs on a computing grid
US20040225711A1 (en) * 2003-05-08 2004-11-11 Spotware Technologies, Inc. System for administering computers on a computing grid
US8055753B2 (en) * 2003-06-11 2011-11-08 International Business Machines Corporation Peer to peer job monitoring and control in grid computing systems
US8935401B2 (en) * 2003-06-20 2015-01-13 Hewlett-Packard Development Company, L.P. Method and system using admission control in interactive grid computing systems
US7472112B2 (en) * 2003-06-23 2008-12-30 Microsoft Corporation Distributed query engine pipeline method and system
US7272732B2 (en) * 2003-06-30 2007-09-18 Hewlett-Packard Development Company, L.P. Controlling power consumption of at least one computer system
US20050021349A1 (en) * 2003-07-23 2005-01-27 International Business Machines Corporation Method and system for providing a computing resource service
US7594015B2 (en) * 2003-07-28 2009-09-22 Sap Ag Grid organization
US8856163B2 (en) * 2003-07-28 2014-10-07 Google Inc. System and method for providing a user interface with search query broadening
US8776050B2 (en) * 2003-08-20 2014-07-08 Oracle International Corporation Distributed virtual machine monitor for managing multiple virtual resources across multiple physical nodes
US7877754B2 (en) * 2003-08-21 2011-01-25 International Business Machines Corporation Methods, systems, and media to expand resources available to a logical partition
US7533168B1 (en) * 2003-09-11 2009-05-12 Sun Microsystems, Inc. Autonomic grid computing mechanism
US7472184B2 (en) * 2003-09-19 2008-12-30 International Business Machines Corporation Framework for restricting resources consumed by ghost agents
US20050108394A1 (en) * 2003-11-05 2005-05-19 Capital One Financial Corporation Grid-based computing to search a network
US7454496B2 (en) * 2003-12-10 2008-11-18 International Business Machines Corporation Method for monitoring data resources of a data processing network
US7124062B2 (en) * 2003-12-30 2006-10-17 Sap Ag Services search method
US7562143B2 (en) * 2004-01-13 2009-07-14 International Business Machines Corporation Managing escalating resource needs within a grid environment
US7552437B2 (en) * 2004-01-14 2009-06-23 International Business Machines Corporation Maintaining application operations within a suboptimal grid environment
TW200532466A (en) * 2004-02-03 2005-10-01 Sony Corp Information processing device, information processing method, information processing system and information processing program of accessible media
CN101120340B (zh) 2004-02-21 2010-12-08 数据迅捷股份有限公司 超无共享并行数据库
US20050257079A1 (en) * 2004-04-27 2005-11-17 Andrea Arcangeli System for the creation of a supercomputer using the CPU of the computers connected to internet
US7584274B2 (en) * 2004-06-15 2009-09-01 International Business Machines Corporation Coordinating use of independent external resources within requesting grid environments
US7340654B2 (en) * 2004-06-17 2008-03-04 Platform Computing Corporation Autonomic monitoring in a grid environment
US7421402B2 (en) * 2004-08-19 2008-09-02 International Business Machines Corp. Tier-based dynamic incentive arbitration in an on-demand computing environment
US7765552B2 (en) * 2004-09-17 2010-07-27 Hewlett-Packard Development Company, L.P. System and method for allocating computing resources for a grid virtual system
US7640308B2 (en) * 2004-09-30 2009-12-29 Microsoft Corporation Systems and methods for detection and removal of metadata and hidden information in files
US20060075042A1 (en) * 2004-09-30 2006-04-06 Nortel Networks Limited Extensible resource messaging between user applications and network elements in a communication network
US7433931B2 (en) * 2004-11-17 2008-10-07 Raytheon Company Scheduling in a high-performance computing (HPC) system
US7996455B2 (en) * 2005-06-17 2011-08-09 Adaptive Computing Enterprises, Inc. System and method for providing dynamic roll-back reservations in time

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102209134A (zh) * 2010-03-30 2011-10-05 深圳富泰宏精密工业有限公司 自动撷取日志的系统及方法
CN102591771A (zh) * 2010-11-18 2012-07-18 国际商业机器公司 关于对访问请求的意外响应验证计算机程序的方法和装置
CN105579965A (zh) * 2013-09-23 2016-05-11 亚马逊科技公司 经由提供商定义接口的客户端驻地资源控制
CN105579965B (zh) * 2013-09-23 2019-09-03 亚马逊科技公司 经由提供商定义接口的客户端驻地资源控制

Also Published As

Publication number Publication date
US20090132703A1 (en) 2009-05-21
US20060150157A1 (en) 2006-07-06
US7502850B2 (en) 2009-03-10
WO2006072546A1 (en) 2006-07-13
JP2008527513A (ja) 2008-07-24
EP1839145A1 (en) 2007-10-03
US7743142B2 (en) 2010-06-22
CN100578455C (zh) 2010-01-06

Similar Documents

Publication Publication Date Title
CN100578455C (zh) 提交给网格环境的网格作业使用前的资源功能性验证
EP3149591B1 (en) Tracking application deployment errors via cloud logs
US9002997B2 (en) Instance host configuration
US7533170B2 (en) Coordinating the monitoring, management, and prediction of unintended changes within a grid environment
CN100405301C (zh) 在次最佳网格环境中维持应用工作的方法和系统
US8073880B2 (en) System and method for optimizing storage infrastructure performance
US8539507B2 (en) Service oriented architecture
AU2014209611B2 (en) Instance host configuration
US9154366B1 (en) Server maintenance modeling in cloud computing
US8966025B2 (en) Instance configuration on remote platforms
US20220094600A1 (en) Managed remediation of non-compliant resources
CN102859505B (zh) 管理系统以及计算机系统的管理方法
US7302477B2 (en) Administration tool for gathering information about systems and applications including the feature of high availability
CN107992491A (zh) 一种分布式文件系统、数据访问和数据存储的方法及装置
CN109902028A (zh) Acl特性的自动化测试方法、装置、设备及存储介质
CN102656572B (zh) 用于形成包括配置信息的获取受到限制的配置要素在内的系统的配置要素的配置信息的系统、程序及方法
CN104951855A (zh) 用于促进对资源的管理的装置和方法
CN105827744A (zh) 云存储平台的数据处理方法
CN102112978B (zh) 资源部署管理
JP2005165673A (ja) 性能監視システム、管理サーバ装置、情報処理方法及びプログラム
CN117236645B (zh) 一种基于设备信息分类的数据中心用it资产管理系统
CN117609973A (zh) 一种注册中心纳管方法、系统、装置及服务器
CN115668152A (zh) 应用拓扑发现
Butler et al. Enterprise storage software lifecycle management system
Nazer et al. A Simplex Grid Computing Methodology For Monitoring Resources

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100106

Termination date: 20181219