CN101273334A - 向逻辑分区指派处理器以及在故障时用不同的处理器替换该处理器 - Google Patents

向逻辑分区指派处理器以及在故障时用不同的处理器替换该处理器 Download PDF

Info

Publication number
CN101273334A
CN101273334A CN200680035837.3A CN200680035837A CN101273334A CN 101273334 A CN101273334 A CN 101273334A CN 200680035837 A CN200680035837 A CN 200680035837A CN 101273334 A CN101273334 A CN 101273334A
Authority
CN
China
Prior art keywords
processor
subregion
priority
assigned
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200680035837.3A
Other languages
English (en)
Other versions
CN101273334B (zh
Inventor
W·J·阿姆斯特朗
N·纳亚尔
G·R·里卡德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101273334A publication Critical patent/CN101273334A/zh
Application granted granted Critical
Publication of CN101273334B publication Critical patent/CN101273334B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2035Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2043Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share a common memory address space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • G06F9/4856Task life-cycle, e.g. stopping, restarting, resuming execution resumption being on a different machine, e.g. task migration, virtual machine migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5011Pool
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5021Priority

Abstract

向支持多逻辑分区的计算机中的逻辑分区指派处理器,其包括:向分区指派优先级;检测分区的故障处理器的检错停机;检索所述故障处理器的状态;由系统管理程序用替换处理器替换所述故障处理器,其中,所述替换处理器来自具有比所述故障处理器的分区的优先级更低的优先级的分区;以及将所检索的所述故障处理器的状态指派为所述替换处理器的状态。

Description

向逻辑分区指派处理器以及在故障时用不同的处理器替换该处理器
技术领域
本发明的领域是数据处理,或者更具体地说是用于向支持多逻辑分区的计算机中的逻辑分区指派处理器的方法、装置和产品。
背景技术
1948年的EDVAC计算机系统的开发通常被引用作为计算机时代的开始。自从那时起,计算机系统已演进为极端复杂的设备。现今的计算机比例如EDVAC的早期系统复杂得多。计算机系统典型包括硬件和软件部件的组合、应用程序、操作系统、处理器、总线、存储器、输入/输出设备等。半导体处理和计算机体系结构的进步推动计算机的性能越来越高,更复杂的计算机软件已演进为利用硬件的所述更高性能,其导致现今的计算机系统比仅仅几年前强大得多。
在其中已经做出进步的一个领域是:许多执行线程在被指派了其自己的资源并且运行单独的操作系统的分区中的并行处理。计算机硬件和软件向高度并行的被逻辑上分区的模型的转变已为高度的系统可用性提供了机会,而这在仅仅几年前实际不存在。用于维持高度可用性的一种机制允许用未使用处理器对于被预测将出故障的处理器进行动态运行时替换,这是在故障处理器可以继续运行足够长时间以完成替换过程的条件下进行的。用于高度可用性的另一种机制维护完整的处理器状态信息,从而甚至在灾难性处理器故障(例如检错停机(checkstop))发生的情况下,处理器正在实施的工作可以在替换处理器上继续。替换处理器在这些恢复机制中的重要性是显而易见的。在未使用的处理器可用的情况下去哪儿获得这些替换是清楚的。然而,未使用的处理器一般是浪费并且昂贵的,以及因此在多数系统上很少见。当处理器检错停机并且没有任何未使用处理器可用时,系统有两个选择:其可以终止,或者底层的系统管理程序(hypervisor)可以就像其拥有比物理上可用的更多的处理器一样来运行分区。这两种情况都是不希望的;在前一种情况下,分区是失效的,以及在后一种情况下,分区没有在希望的性能水平上运行。当然,如果已用的处理器检错停机,则所述系统上的某个分区必须受到影响,但允许基于随机的故障处理器来选择受影响分区不是最优的过程。
发明内容
这样的方法、装置和计算机程序产品被公开,其一般运转为:经由使用已指派的分区优先级向支持多逻辑分区的计算机中的逻辑分区指派替换处理器,以便允许系统上的所有处理器都实施有用工作直到一个处理器被需要作为替换处理器,以及一旦被需要,则以降低对终端用户操作的影响的可预测方式重分配处理资源。更特别地,这样的方法、装置和计算机程序产品被公开,其用于向支持多逻辑分区的计算机中的逻辑分区指派处理器,其包括:向分区指派优先级;检测分区的故障处理器的检错停机;检索所述故障处理器的状态;由系统管理程序用替换处理器替换所述故障处理器,其中,所述替换处理器来自具有比所述故障处理器的分区的优先级更低的优先级的分区;以及,将所检索的所述故障处理器的状态指派为所述替换处理器的状态。
从下面对如附图中所示的本发明的示例性实施例的特别描述中,本发明的前述和其它目的、特征和优点将显而易见,在附图中,相同标号一般表示本发明的示例性实施例的相同部分。
附图说明
图1示出了包括根据本发明的实施例的可用于向逻辑分区指派处理器的示例性计算机的自动化计算机器的框图。
图2示出了根据本发明的实施例的用于向逻辑分区指派处理器的示例性系统的功能框图。
图3示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的示例性方法的流程图。
图4示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。
图5示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。
图6示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。
图7示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。
图8示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。
图9示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。
具体实施方式
根据本发明的实施例的用于向逻辑分区指派处理器的示例性方法、装置和产品参考附图被描述,首先是图1。根据本发明的实施例向逻辑分区指派处理器一般用计算机(即自动化计算机器)来实现。因此,为进一步解释,图1示出了包括根据本发明的实施例的可用于向逻辑分区指派处理器的示例性计算机(152)的自动化计算机器的框图。图1的计算机(152)包括若干物理处理器(156)以及通过系统总线(160)连接到处理器(156)和该计算机的其它部件的随机存取存储器(168)(RAM)。存储在RAM(168)中的是系统管理程序(184)和用于管理逻辑分区(LPAR)的计算机程序指令。系统管理程序(184)管理例如存储器和处理资源的物理资源向LPAR的指派、控制可以从LPAR中访问的物理存储器位置、以及控制对I/O存储器空间的访问。另外,系统管理程序(184)调度物理处理器上的虚拟处理器,以及管理虚拟处理器向LPAR的指派。
本示例中的系统管理程序(184)被改进为根据本发明的实施例向支持多逻辑分区的计算机中的逻辑分区指派处理器,所述指派是经由:向分区指派优先级;检测分区的故障处理器的检错停机;检索所述故障处理器的状态;由系统管理程序用替换处理器替换所述故障处理器,其中,所述替换处理器来自具有比所述故障处理器的分区的优先级更低的优先级的分区;以及将已检索的所述故障处理器的状态指派为所述替换处理器的状态。
还存储在RAM(168)中的是虚拟处理器(122),其是表示物理处理器资源向LPAR的指派的计算机程序指令。还存储在RAM(168)中的是LPAR(104),其是支持由单一计算机中的系统管理程序进行的计算机资源的分布以使该计算机就像其是两个或更多个独立计算机一样运转的一组数据结构和服务。LPAR被指派了为了使其就像是独立计算机一样地运转所需要的所有资源,所述资源包括处理器时间、存储器、操作系统等。还存储在RAM中的是应用程序(158),其是用于用户级数据处理的计算机程序指令。
还存储在RAM(168)中的是操作系统(154)。可用于根据本发明的实施例的计算机中的操作系统包括UNIXTM、LinuxTM、Microsoft NTTM、AIXTM、IBM的i5/OSTM以及本领域的技术人员将想到的其它的操作系统。图1的示例中的系统管理程序(184)、虚拟处理器(122)、操作系统(154)、LPAR(104)和应用程序(158)被示为在RAM(168)中,但所述软件的许多组件典型地还被存储在非易失性存储器(166)中。
图1的计算机(152)包括通过系统总线(160)耦合到物理处理器(156)和计算机(152)的其它部件的非易失性计算机存储器(166)。非易失性计算机存储器(166)可以被实现为硬盘驱动器(170)、光盘驱动器(172)、电可擦除可编程只读存储器空间(所谓的“EEPROM”或“闪速”存储器)(174)、RAM驱动器(未示出)或本领域的技术人员将想到的任意其它种类的计算机存储器。
图1的示例计算机包括一个或更多输入/输出接口适配器(178)。计算机中的输入/输出接口适配器例如通过用于控制向例如计算机显示器屏幕的显示设备(180)的输出以及从例如键盘和鼠标的用户输入设备(181)的用户输入的软件驱动程序或计算机硬件来实现面向用户的输入/输出。
图1的示例性计算机(152)包括用于实现与其它计算机(182)的数据通信(184)的通信适配器(167)。所述数据通信可以通过RS-232连接、通过例如USB的外部总线、通过例如IP网络的数据通信网络以及以本领域的技术人员将想到的其它方式来串行地实现。通信适配器实现硬件层的数据通信,通过所述硬件层的数据通信,一台计算机直接地或通过网络向另一计算机发送数据通信。可用于根据本发明的实施例确定目的地的可用性的通信适配器的示例包括:用于有线拨号通信的调制解调器、用于有线网络通信的以太网(IEEE 802.3)适配器和用于无线网络通信的802.11b适配器。
图2示出了根据本发明的实施例的用于向逻辑分区指派处理器的示例性系统的功能框图。图2的系统包括系统管理程序(184),其是管理LPAR的系统软件层。本示例中的系统管理程序(184)被改进为根据本发明的实施例向支持多逻辑分区的计算机中的逻辑分区指派处理器,所述指派是经由:向分区指派优先级;检测分区的故障处理器的检错停机;检索所述故障处理器的状态;由系统管理程序用替换处理器替换所述故障处理器,其中,所述替换处理器来自具有比所述故障处理器的分区的优先级更低的优先级的分区;以及将已检索的所述故障处理器的状态指派为所述替换处理器的状态。
图2还包括LPAR(103、104、105)。每个LPAR(103、104、105)具有在其中运行的操作系统(154、155、157),并且每个操作系统可以是不同的。具有三个LPAR的系统例如可以同时在一个LPAR中运行LinuxTM,在另一个LPAR中运行IBM的AIXTM以及在另一个LPAR中运行IBM的i5/OS。
图2还包括多个物理处理器(156、158、160、162、164、166、168)。物理处理器(156、158)通过虚拟处理器(121、123)独占地专用于LPAR(103)。物理处理器这样独占地专用于的LPAR在本说明书中称为“专用LPAR”。本示例中的物理处理器(160、162、164、166、168)通过虚拟处理器(124、126、128、130、132、134)被LPAR(104、105)共享。
虚拟处理器(124、126、128、130、132、134)被聚集在可用于向LPAR(104、105)进行指派的虚拟处理器池(153)中。每个虚拟处理器表示向LPAR指派由支持池(153)的物理处理器(160、162、164、166、168)提供的处理能力的一部分。由虚拟处理器表示的支持池的物理处理器的所述一部分可以是物理处理器的一部分或整个物理处理器。因此,LPAR(104、105)通过由系统管理程序(184)向每个所述LPAR指派的已集中在池中的虚拟处理器而间接共享物理处理器。通过已集中在池中的虚拟处理器间接共享物理处理器的所述LPAR在本说明书中称为“已共享处理器分区”或“已共享处理器LPAR”。
在图2的示例中,七个物理处理器(156、158、160、162、164、166、168)的处理能力被所述系统管理程序按照如下分配给三个LPAR(103、104、105):
-物理处理器(156、158)的所有处理能力通过虚拟处理器(121、123)被指派给LPAR(103)。
-等价于2.5个处理器的、由物理处理器(160、162、164、166、168)表示的处理能力的一部分通过虚拟处理器(124、126、128)被分配给LPAR(104)。
-等价于2.5个处理器的、由物理处理器(160、162、164、166、168)表示的处理能力的一部分通过虚拟处理器(130、132、134)被分配给LPAR(105)。
图2的系统中的物理处理器、虚拟处理器和LPAR的数量、排列和指派仅用于解释,其不是本发明的限制。用于向支持多逻辑分区的计算机中的逻辑分区指派处理器的系统可以包括物理处理器、虚拟处理器和LPAR的任意数量、排列或指派。
为进一步解释,图3示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的示例性方法的流程图,其中,所述指派包括向分区(320、322)指派(304)优先级(310)。向分区指派优先级可以经由从用户(302)获得分区的优先级以及经由存储由用户(302)指派的所述优先级来实现。可替换地,向分区指派优先级可以经由监视分区上的负载以及取决于所述负载指派优先级来实现,其中,优先级随着负载增长。可替换地,向分区指派优先级可以经由从用户获得优先级、经由监视分区上的负载、以及经由基于所述负载和来自所述用户的输入指派所述优先级来实现。
图3的方法还包括检测(312)分区(320)的故障处理器(308)的检错停机。“检错停机”当此术语用在本说明书中时是这样的处理器运转错误,其本身或结合其它错误而足够严重到确立该处理器的替换。物理处理器典型用有引导的(vectored)硬件中断来通过信号发送处理器运转错误。对检错停机的检测可以经由将中断从物理处理器的处理器运转错误引导到系统管理程序的中断处理例程来实现。始自处理器的任意一个或多个错误条件可以形成或导致检错停机,所述检错停机例如包括本领域的技术人员将想到的存储器边界错误、操作码错误、协处理器分段错误、存储器地址错误、算术或浮点错误、存储器对齐错误、机器检查异常等。对检错停机的检测可以包括将特定错误定义为单独就足以确立处理器替换。可替换地,对检错停机的检测可以包括保持处理器运转错误的计数以及将检错停机标识为等于预定义阈值的计数。
图3的方法还包括检索(314)故障处理器的状态(316)。检索(314)故障处理器的状态(316)可以经由系统管理程序直接从处理器读取该处理器的寄存器的当前值并且将所述处理器的寄存器的值临时存储在该物理处理器外部的随机存取存储器中来实现。
图3的方法还包括由系统管理程序(184)用替换处理器(326)替换(318)故障处理器(308),其中,替换处理器(326)来自具有比故障处理器的分区(320)的优先级更低的优先级的分区(322)。在图3的示例中,处理器(308)是被完全并且独占地指派到专用LPAR(320)的故障处理器。LPAR(320)具有优先级1,其是比LPAR(322)更高的优先级。LPAR(322)是被指派了处理器(326)的全部能力的专用LPAR。在本示例中,因为处理器(326)被指派给具有较低优先级的LPAR,所以处理器(326)被标识为替换处理器。系统管理程序可以经由使用类似于表1中所示的数据结构而用替换处理器(326)替换(318)故障处理器(308):
Figure A20068003583700121
表1有五列。给该表中的每个记录指派一个标号的“记录号”列仅为了便于解释。“LPAR”列中的值标识分区。“VP”列中的值标识虚拟处理器。“PP”列中的值标识物理处理器。以及,“部分(Portion)”列中的值标识处理能力,其用指派给虚拟处理器——以及通过虚拟处理器间接指派给分区的物理处理器的几分之一来表示。
表1中的每个记录表示通过虚拟处理器指派给LPAR的物理处理器的一部分。记录号1表示通过虚拟处理器(121)完全(部分=1.0)指派给LPAR(320)的故障处理器(308)。记录号2表示通过虚拟处理器(123)完全(部分=1.0)指派给LPAR(322)的替换处理器(326)。
系统管理程序(184)可以经由如表2中所示地那样更新表1的数据来用替换处理器(326)替换(318)故障处理器(308):
Figure A20068003583700122
表2示出了现在未指派给任意LPAR的故障处理器(308)和通过虚拟处理器(121)完全(部分=1.0)指派给LPAR(320)的替换处理器(326)。系统管理程序对将处理器指派给LPAR的数据值的更新相对于任意操作系统或应用程序的运转完全透明地在中断处理期间发生。当系统管理程序从其中断处理例程返回控制时,操作系统或应用程序然后在所述替换处理器上继续运转,而完全没意识到所述替换已发生。在本示例中,LPAR(322)失去其被唯一指派的处理器——替换处理器(326),该替换处理器(326)通过虚拟处理器(121)被重新指派给LPAR(320)。因此,在本示例中,LPAR(322)将被终止。
图3的方法还包括将所检索的故障处理器(308)的状态(316)指派(319)为替换处理器(326)的状态。所检索的故障处理器的状态是当检错停机被系统管理程序检测到时故障处理器的寄存器的值。将所检索的故障处理器(308)的状态(316)指派(319)为替换处理器(326)的状态可以经由将所检索的状态(316)存储在替换处理器的寄存器中来实现。
为进一步解释,图4示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。图4的方法类似于图3的方法,其在于,图4的方法包括:向分区指派(304)优先级;检测(312)分区的故障处理器的检错停机;检索(314)所述故障处理器的状态;以及将所检索的所述故障处理器的状态指派(319)为替换处理器的状态——所有步骤以与上面描述的图3的方法类似的方式运转。
图4的方法还包括由系统管理程序(184)用替换处理器(418)替换(318)故障处理器(412),其中,替换处理器(418)来自具有比故障处理器的分区(404)的优先级更低的优先级的分区(408)。然而,在图4的方法中,故障物理处理器(412)被指派给专用分区(404),最低优先级分区(408)是专用分区,以及替换故障处理器(412)包括终止(402)最低优先级分区(408)。在图4的示例中,处理器(412)是通过虚拟处理器(123)完全并且独占地指派给专用LPAR(404)的故障处理器。作为专用LPAR的LPAR(408)具有优先级4,其是比具有优先级2的LPAR(404)或具有优先级3的LPAR(406)更低的优先级。LPAR(408)通过虚拟处理器(129)被指派了处理器(418)的全部能力。在本示例中,因为处理器(418)被指派给具有最低优先级的LPAR,所以处理器(418)被标识为替换处理器——用于替换故障处理器(412)。
在图4的方法中,替换(318)故障处理器包括终止(402)最低优先级分区(408)。终止(402)最低优先级分区(408)可以经由停止运行在最低优先级分区(408)上的程序、停止运行在最低优先级分区(408)上的操作系统以及从类似于上面讨论的表1和2的、表示物理处理器向LPAR的指派的表中移除LPAR(408)来实现。表示做出这些改变后的物理处理器向LPAR的指派的已更新表如表3所示:
表3示出了未指派给任意LPAR的故障处理器(412)和通过虚拟处理器(123)完全(部分=1.0)指派给专用LPAR(404)的替换处理器(418)。处理器(414)继续通过虚拟处理器(125)被完全指派给LPAR(406)。LPAR(408)已被终止。已通过虚拟处理器(127)被指派给已终止的LPAR(408)的另一处理器——处理器(416)现在未被指派给任何LPAR。
为进一步解释,图5示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。图5的方法类似于图3的方法,其在于,图5的方法包括:向分区指派(304)优先级;检测(312)分区的故障处理器的检错停机;检索(314)故障处理器的状态;以及将所检索的故障处理器的状态指派(319)为替换处理器的状态——所有步骤以与上面描述的图3的方法类似的方式运转。
图5的方法还包括由系统管理程序(184)用替换处理器(520)替换(318)故障处理器(410),其中,替换处理器(520)来自具有比故障处理器的分区(404)的优先级更低的优先级的分区(504、506)。然而,在图5的方法中,故障处理器(410)被指派给专用分区(404),具有比故障处理器(410)的分区(404)更低的优先级的分区包括一个或更多共享处理器分区(504、506),以及替换(318)故障处理器(410)包括终止(502)具有比故障处理器(410)的分区(404)更低的优先级的足够数量的共享处理器分区(504、506)以释放替换处理器(520)。在图5的示例中,处理器(410)是通过虚拟处理器(121)完全并且独占地指派给专用LPAR(404)的故障处理器。LPAR(504、506)是通过已集中在池中的虚拟处理器(510、512、514)间接共享来自物理处理器(530、531、520)的处理能力的共享处理器LPAR。通过已集中在池中的虚拟处理器(510、512、514),LPAR(504、506)被指派1.25个处理器的处理能力:通过虚拟处理器(510)给LPAR(504)的0.5个处理器,通过虚拟处理器(512)给LPAR(506)的0.5个处理器,以及通过虚拟处理器(512)给LPAR(506)的0.25个处理器。因此,终止LPAR(504、506)终止具有比故障处理器(410)的分区(404)更低的优先级的足够数量的共享处理器分区以释放处理器。
支持池(532)的三个处理器(530、531、520)的任一个在不影响由该池支持的剩余共享处理器LPAR的运转的情况下可以被看作替换处理器。剩余的共享处理器LPAR(508)通过虚拟处理器(516、518)被指派1.0个处理器的处理能力,以及取被指派给该池的物理处理器中的一个来替换故障处理器使得剩下被指派为支持池的两个物理处理器,其中,所述池目前仅需要一个物理处理器来满足其向该池的虚拟处理器的处理能力的指派。
终止具有比故障处理器(410)的分区(404)更低的优先级的足够数量的共享处理器分区(504、506)以释放处理器(520)可以经由停止运行在已终止共享处理器分区(504、506)上的程序、停止运行在已终止共享处理器分区(504、506)上的操作系统以及从与上面讨论的表1和2类似的、表示向LPAR的物理处理器的指派的表中移除LPAR(504、506)来实现。表示做出这些改变之前向LPAR的物理处理器的指派的表如表4所示:
表4示出了通过虚拟处理器(121、123)完全(部分=1.0)指派给专用LPAR(404)的处理器(410、412)。共享处理器分区(504、506、508)通过已集中在池中的虚拟处理器(510-518)被指派来自指派给所述池的物理处理器(520、530、531)的处理资源。LPAR(504)通过虚拟处理器(510)被指派0.5个物理处理器的处理能力。LPAR(506)通过虚拟处理器(512、514)被指派0.75个物理处理器的处理能力。LPAR(508)通过虚拟处理器(516、518)被指派1.0个物理处理器的处理能力。
表5表示在做出用替换处理器(520)替换故障处理器(410)后向LPAR的物理处理器的重指派:
Figure A20068003583700162
表5示出了目前未指派给LPAR的故障处理器(410)和通过虚拟处理器(121)完全(部分=1.0)指派给专用LPAR(404)的替换处理器(520)。处理器(412)继续通过虚拟处理器123被指派给LPAR(404)。LPAR(504、506)被终止;其条目被从所述表删除。LPAR(508)继续像以前一样以通过已集中在池中的虚拟处理器(516、518)指派的1.0个物理处理器的处理能力而运转。
为进一步解释,图6示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。图6的方法类似于图3的方法,其在于,图6的方法包括:向分区指派(304)优先级;检测(312)分区的故障处理器的检错停机;检索(314)故障处理器的状态;以及将所检索的故障处理器的状态指派(319)为替换处理器的状态——所有步骤以与上面描述的图3的方法类似的方式运转。
图6的方法还包括由系统管理程序(184)用替换处理器(616)替换(318)故障处理器(410),其中,替换处理器(616)来自具有比故障处理器的分区(404)的优先级更低的优先级的分区(604)。然而,在图6的方法中,故障处理器(410)被指派给专用分区(404),具有比故障处理器(410)的分区(404)的优先级更低的优先级的分区包括一个或更多共享处理器分区(604),以及替换(318)故障处理器(410)包括:调拨过度地(overcommitted)运行(402)具有比故障处理器(410)的分区(404)更低的优先级的一个或更多共享处理器分区(604),以在不终止分区的情况下释放替换处理器。在图6的示例中,处理器(410)是通过虚拟处理器(121)完全并且独占地指派给具有优先级=2的专用LPAR(404)的故障处理器。
LPAR(604)是具有优先级=4的共享处理器LPAR,其优先级比故障处理器(410)的分区(404)的优先级(=2)更低。LPAR(625)是具有优先级=1的共享处理器LPAR,其优先级比故障处理器(410)的分区(404)的优先级(=2)更高。因此,在LPAR(604)和LPAR(625)之间,LPAR(604)被选为调拨过度地运行。
LPAR(604)是通过已集中在池中的虚拟处理器(606、608、610、612)间接共享来自物理处理器(616、618、620)的处理能力的共享处理器LPAR。通过已集中在池中的虚拟处理器(606、608、610、612),LPAR(604)被指派3.0个处理器的处理能力:通过虚拟处理器(606)的0.5个处理器,通过虚拟处理器(608)的0.5个处理器,通过虚拟处理器(610)的1.0个处理器,通过虚拟处理器(612)的1.0个处理器。支持池(631)的三个处理器(616、618、620)中的任一个可以被取作替换处理器,使得剩下LPAR(604)仅具有用于支持池的两个物理处理器(618、620),其中,所述池已向其虚拟处理器(606、608、610、612)调拨3.0个物理处理器的处理能力。
在图6的方法中,没有任何分区被终止以释放替换处理器。作为代替,替换(318)故障处理器(410)经由调拨过度地运行(602)具有比故障处理器(410)的分区(404)更低的优先级的一个或更多共享处理器分区(604)来实现。替换处理器(616)来自支持为共享处理器分区(604)提供处理能力的虚拟处理器池(631)的一组处理器(616、618、620)。因此,共享处理器分区(604)被调拨过度地运行以释放替换处理器。调拨过度地运行共享处理器分区是指:由该分区的虚拟处理器表示的处理能力大于被指派为提供该能力的虚拟处理器的数量。当调拨过度地运行共享处理器分区时,被指派给该共享处理器分区的虚拟处理器比用于支持它们的物理处理器更多。
当共享处理器分区被调拨过度地运行时,在任意特定的数据处理期间,物理处理器上存在的时间片比本应当有的更少,其中,系统管理程序可以向所述时间片中分派所述共享处理器分区的虚拟处理器,并且系统管理程序成比例地减少每个虚拟处理器被分派的次数。例如,在图6的方法中,当指派给池(631)的物理处理器在数量上从3减少到2时,系统管理程序可以针对总共仅2.0个物理处理器的处理能力而非实际指派给LPAR(604)的3.0个处理器的能力,而分别为虚拟处理器(606、608、610、612)提供0.3、0.3、0.7和0.7个物理处理器的处理能力。因此,当被调拨过度地运行时,共享处理器分区(604)不会达到由被指派给该分区的虚拟处理器的数量所指示的性能;共享处理器分区将以已降级的性能运行。
为进一步解释,图7示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。图7的方法类似于图3的方法,其在于,图7的方法包括:向分区指派(304)优先级;检测(312)分区的故障处理器的检错停机;检索(314)故障处理器的状态;以及将所检索的故障处理器的状态指派(319)为替换处理器的状态-所有步骤以与上面描述的图3的方法类似的方式运转。
图7的方法还包括由系统管理程序(184)用替换处理器(708)替换(318)故障处理器(722),其中,替换处理器(708)来自具有比故障处理器的分区(705、732)的优先级更低的优先级的分区(704)。在然而,图7的方法中,故障处理器(722)被指派给虚拟处理器(722、724、726、728)的池(731),其中,该虚拟处理器的池支持一个或更多共享处理器分区(705、732),最低优先级分区(704)是专用分区,以及替换(318)故障处理器(722)包括终止(702)最低优先级分区(704)。在图7的示例中,处理器(722)是指派给虚拟处理器(712、714、716、718、720、730)的池(731)的故障处理器。作为专用LPAR的LPAR(704)具有比LPAR(705)(优先级=4)更低的优先级(优先级=12)以及比LPAR(732)(优先级=2)更低的优先级。LPAR(704)通过虚拟处理器(121)被指派了处理器(708)的全部能力。在本示例中,因为处理器(708)被指派给具有最低优先级的专用LPAR,所以处理器(708)被标识为替换处理器。
如上面提到的,LPAR(704)是图7的示例中的最低优先级分区。因此,终止最低优先级分区在本示例中可以经由终止LPAR(704)来实现。终止(702)LPAR(704)可以经由停止在LPAR(704)中运行的任意程序、停止在LPAR(704)中运行的操作系统、以及从与上面讨论的表1和2类似的、表示向LPAR的物理处理器的指派的表中移除LPAR(704)来实现。表示在移除LPAR(704)之前的、在图7的示例中向LPAR的物理处理器的指派的表如表6所示:
Figure A20068003583700201
表6示出了通过虚拟处理器(121、123)完全指派给专用LPAR(704)的处理器(708、710)。处理器(722、724、726、728)通过已集中在池中的虚拟处理器(712、714、716、718、720、730)被指派给共享处理器LPAR(705、732)。表7表示在终止最低优先级分区LPAR(704)之后向LPAR的物理处理器的重指派:
Figure A20068003583700202
表7示出了通过已集中在池中的虚拟处理器(712、714、716、718、720、730)随同其它物理处理器(724、726、728)一起被指派给共享处理器LPAR(705、732)的替换处理器(708)。故障处理器(722)被完全从表7删除,以及之前指派给已终止分区(704)的处理器(710)现在被示为未指派。
为进一步解释,图8示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。图8的方法与图3的方法类似,其在于,图8的方法包括:向分区指派(304)优先级;检测(312)分区的故障处理器的检错停机;检索(314)故障处理器的状态;以及将所检索的故障处理器的状态指派(319)为替换处理器的状态——全部步骤以与上面描述的图3的方法类似的方式运转。
图8的方法还包括由系统管理程序(184)用替换处理器(822)替换(318)故障处理器(820),其中,替换处理器(822)来自具有比故障处理器的分区(804、806)的优先级更低的优先级的分区(808、825)。然而,在图8的方法中,故障处理器(820)被指派给虚拟处理器(810、812、814)的池(831)。该虚拟处理器的组支持一个或更多共享处理器分区(804、806)。在图8的示例中,具有比由池(831)支持的共享处理器分区(804、806)(优先级=3,4)更低的优先级(优先级=9,10)的共享处理器分区(808、825)可用,以及,替换(318)故障处理器(820)包括终止具有比由池(831)支持的共享处理器分区(804、806)更低的优先级的足够数量的共享处理器分区(808、825)以释放替换处理器。
被指派为支持共享处理器分区(808、825)的处理器(822)被选作替换处理器,其中,共享处理器分区(808、825)具有比故障处理器(820)通过池(831)被指派到的共享处理器分区更低的优先级。在本示例中,通过池(833)被指派为支持较低优先级分区(808、825)的处理器(822、824)的任一个可以被选作替换处理器。在本示例中,LPAR(808、825)是具有比故障处理器(820)的一个或更多共享处理器分区(804、806)更低的优先级的LPAR,以及替换处理器(822)被指派给LPAR(808、825)。较低优先级分区(808、825)的每个被指派来自池(833)的1.0个处理器的处理能力,以及1.0个处理器是替换故障处理器(802)所需的。因此,终止具有比由池(831)支持的共享处理器分区更低的优先级的足够数量的共享处理器分区在本示例中可以经由终止所述两个较低优先级分区(808、825)的任一个来实现。终止共享处理器分区可以经由停止该分区上运行的程序、停止该分区上运行的操作系统、以及从与上面讨论的表1和2类似的、表示向已集中在池中的虚拟处理器的物理处理器的指派的表移除针对该分区的任何条目来实现。表示在移除共享处理器分区之前通过已集中在池中的虚拟处理器向共享处理器分区的物理处理器的指派的表如表8所示:
Figure A20068003583700221
表8示出了通过已集中在池中的虚拟处理器(810、812、814)完全指派给共享处理器分区(804、806)的物理处理器(820)。根据表8。物理处理器(822、824)通过已集中在池中的虚拟处理器(816、818、827、829)被指派给虚拟处理器分区(808、825)。表9表示在终止最低优先级分区LPAR(825)之后向共享处理器分区的物理处理器的重指派:
Figure A20068003583700222
表9示出了通过已集中在池中的虚拟处理器(810、812、814)被指派给共享处理器LPAR(804、806)的替换处理器(822)。故障处理器(820)被从表9完全删除。已终止的共享处理器分区(825)及支持其的虚拟处理器(827、829)被从表9完全删除。所有剩余分区就像故障处理器的替换之前那样继续运转。分区(808)通过已集中在池中的虚拟处理器(816、818)被指派1.0个处理器,以及1.0个处理器作为物理处理器(824)被提供。类似地,通过已集中在池中的虚拟处理器(810、812、814)合起来被指派1.0个处理器的分区(804、806)继续拥有替换处理器(822)的1.0个物理处理器的支持。根据图8的方法替换故障处理器对系统性能的唯一影响是低优先级分区(825)的终止。
为进一步解释,图9示出了说明根据本发明的实施例的用于向逻辑分区指派处理器的进一步示例性方法的流程图。图9的方法与图3的方法类似,其在于,图9的方法包括:向分区指派(304)优先级;检测(312)分区的故障处理器的检错停机,检索(314)故障处理器的状态;以及将所检索的故障处理器的状态指派为替换处理器的状态——所有步骤以与上面描述的图3的方法类似的方式运转。
图9的方法还包括由系统管理程序(184)用替换处理器(616)替换(318)故障处理器(410),其中,替换处理器(616)之前被指派给一个或更多较低优先级分区(604)。
图9的方法还包括由系统管理程序(184)用替换处理器(616)代替故障处理器(410),其中,替换处理器(616)来自具有比故障处理器的分区(804、806)更低的优先级的分区(808、810)。然而,在图9的方法中,故障处理器(410)被指派给支持共享处理器分区(804、806)的虚拟处理器(821、823)的池(633)。具有比由池(633)支持的共享处理器分区(804、806)(优先级=2)更低的优先级(优先级=4)的共享处理器分区(808、810)可用,以及替换(318)故障处理器(410)包括调拨过度地运行(902)具有比由池(633)支持的共享处理器分区(804、806)更低的优先级的足够数量的共享处理器分区,以在不中断分区的情况下释放替换处理器。
LPAR(808、810)是具有优先级=4的共享处理器分区,其优先级比由故障处理器(410)被指派到的池(633)支持的分区(804、806)的优先级2更低。LPAR(625)是具有优先级=1的共享处理器分区,其优先级比由故障处理器(410)被指派到的池(633)支持的分区(804、806)更高池(633)。因此,在LPAR(808、810)和LPAR(625)之间,LPAR(808、810)被选为调拨过度地运行,以及LPAR(625)的运转被保持不受影响。
LPAR(808、810)是通过已集中在池中的虚拟处理器(606、608、610、612)间接共享来自物理处理器(616、618、620、622)的共享处理器分区。通过已集中在池中的虚拟处理器(606、608、610、612),LPAR(808、810)被指派3.0个处理器的处理能力:通过虚拟处理器(606)的0.5个处理器,通过虚拟处理器(608)的0.5个处理器,通过虚拟处理器(610)的1.0个处理器,以及通过虚拟处理器(612)的1.0个处理器。支持池(631)的四个处理器(616、618、620、622)的任一个可以被取作替换处理器,使得剩下仅具有三个物理处理器的池(631)来支持虚拟处理器(606、608、610、612),其中,3.0个物理处理器的处理能力被调拨到虚拟处理器(606、608、610、612)。
在图9的方法中,没有任何分区被终止以释放替换处理器。作为代替,替换(318)故障处理器(410)经由调拨过度地运行(902)具有比由池(633)支持的分区(804、806)更低的优先级的一个或更多共享处理器分区(808、810)来实现,其中,故障处理器(410)被指派给池(633)。替换处理器(616)来自支持虚拟处理器池(631)的一组处理器(616、618、620、622),其中,虚拟处理器池(631)为共享处理器分区(808、810)提供处理能力。因此,共享处理器分区(909、810)可以被调拨过度以释放替换处理器。调拨过度地运行共享处理器分区是指:由该分区的虚拟处理器表示的处理能力大于被指派为提供所述能力的物理处理器的数量。当调拨过度地运行共享处理器分区时,被指派给该共享处理器分区的虚拟处理器比用于支持它们的物理处理器更多。
当共享处理器分区被调拨过度地运行时,在任意特定数据处理期间,物理处理器上存在的时间片比本应当有的更少,其中,系统管理程序可以向所述时间片中分派所述共享处理器分区的虚拟处理器,并且系统管理程序成比例地减少每个虚拟处理器被分派的次数。因此,当被调拨过度地运行时,共享处理器分区不会达到由被指派给该分区的虚拟处理器的数量所指示的性能;该共享处理器分区将以已降级的性能运行。
例如在图9的方法中,当指派给池(631)的物理处理器在数量上从四个减少到三个时,因为LPAR(625)未被调拨过度地运行,所以系统管理程序(184)仅拥有两个物理处理器的处理能力来支持LPAR(808、810)的运转。存在系统管理程序(184)可以被编程为调拨过度地运行分区(808、810)的许多方式:
-系统管理程序(194)可以调拨过度地运行分区(808、810),其是经由通过虚拟处理器(606、608、610、612)针对总共仅2.0个物理处理器的处理能力而非通过虚拟处理器(606、608、610、612)实际调拨给分区(808、810)的3.0个处理器的能力,而分别提供0.3、0.3、0.7和0.7个物理处理器的处理能力。
-系统管理程序(194)可以保持分区(808)的运转不受影响,仅调拨过度地运行分区(810),其是经由通过虚拟处理器(610、612)针对总共仅1.0个物理处理器的处理能力而非通过虚拟处理器(610、612)实际调拨给分区(810)的2.0个处理器的能力,而分别提供0.5和0.5个物理处理器的处理能力。
-系统管理程序(194)可以保持分区(808)的运转不受影响,仅调拨过度地运行分区(810),其是经由:终止虚拟处理器(610)的运转,通过虚拟处理器(612)针对总共仅1.0个物理处理器的处理能力而非通过虚拟处理器(610、612)实际调拨给分区(810)的2.0个处理器的能力,而提供1.0个物理处理器的处理能力。
本领域的技术人员可以想到调拨过度地运行所述分区的其它方式,并且所有所述方式都完全落在本发明的范围内。
本发明的示例性实施例主要在用于向逻辑分区指派处理器的完全功能性计算机系统的上下文中被描述。然而,本领域的技术人员将认识到,本发明还可以用部署于信号承载媒体上的用于任意合适的数据处理系统的计算机程序产品来实现。所述信号承载媒体可以是传输媒体或包括磁性媒体、光学媒体或其它合适媒体的用于机器可读信息的可记录媒体。可记录媒体的示例包括硬盘驱动器中的磁盘或软盘、用于光盘驱动器的致密盘、磁带以及本领域的技术人员将想到的其它示例。传输媒体的示例包括用于语音通信的电话网络和数字数据通信网络,其中,数字数据通信网络例如是以太网(EthenetsTM)、使用因特网协议进行通信的网络、和万维网。本领域的技术人员将立即认识到,具有合适的编程装置的任意计算机系统将能够执行用程序产品实现的本发明的方法的步骤。本领域的技术人员将立即认识到,尽管本说明书中描述的一些示例性实施例面向被安装到并且在计算机硬件上执行的软件,然而,作为固件或作为硬件实现的可替换实施例完全落在本发明的范围内。
从前述描述中应当理解,可以在本发明的各个实施例中做出修改和改变,而不脱离其真实精神。本说明书中的描述仅用于说明,而不应当在限制意义上被解释。本发明的范围仅由权利要求的语言所限定。

Claims (10)

1.一种用于向支持多逻辑分区的计算机中的逻辑分区指派处理器的方法,所述方法包括:
向分区指派优先级;
检测分区的故障处理器的检错停机;
检索所述故障处理器的状态;
由系统管理程序用替换处理器替换所述故障处理器,其中,所述替换处理器来自具有比所述故障处理器的分区的优先级更低的优先级的分区;以及
将所检索的所述故障处理器的状态指派为所述替换处理器的状态。
2.根据权利要求1所述的方法,其中:
所述故障处理器被指派给专用分区或虚拟处理器池,其中,所述虚拟处理器池支持至少一个共享处理器分区;
最低优先级分区是专用分区;以及
替换所述故障处理器包括终止所述最低优先级分区。
3.根据权利要求1所述的方法,其中:
所述故障处理器被指派给专用分区或虚拟处理器池,其中,所述虚拟处理器池支持一个或更多共享处理器分区;
具有比由所述池支持的共享处理器分区更低的优先级的共享处理器分区可用;以及
替换所述故障处理器包括:终止具有比由所述池支持的共享处理器分区更低的优先级的足够数量的共享处理器分区以释放替换处理器,或者包括:调拨过度地运行具有比由所述池支持的共享处理器分区更低的优先级的足够数量的共享处理器分区以在不终止分区的情况下释放替换处理器。
4.一种用于向支持多逻辑分区的计算机中的逻辑分区指派处理器的装置,所述装置包括计算机处理器、运转地耦合到所述计算机处理器的计算机存储器,所述计算机存储器具有已在其中部署的这样的计算机程序指令,所述计算机程序指令能够:
向分区指派优先级;
检测分区的故障处理器的检错停机;
检索所述故障处理器的状态;
由系统管理程序用替换处理器替换所述故障处理器,其中,所述替换处理器来自具有比所述故障处理器的分区的优先级更低的优先级的分区;以及
将所检索的所述故障处理器的状态指派为所述替换处理器的状态。
5.根据权利要求4所述的装置,其中:
所述故障处理器被指派给专用分区或虚拟处理器池;
最低优先级分区是专用分区;以及
替换所述故障处理器包括终止所述最低优先级分区。
6.根据权利要求4所述的装置,其中:
所述故障处理器被指派给专用分区或一部分虚拟处理器;
具有比所述故障处理器的分区更低的优先级的分区包括一个或更多共享处理器分区;以及
替换所述故障处理器包括:终止具有比所述故障处理器的分区更低的优先级的足够数量的共享处理器分区以释放替换处理器,或者包括:
具有比所述故障处理器的分区更低的优先级的一个或更多共享处理器分区被调拨过度以在不终止分区的情况下释放替换处理器。
7.一种用于向支持多逻辑分区的计算机中的逻辑分区指派处理器的计算机程序产品,所述计算机程序产品被部署在信号承载媒体上,所述计算机程序产品包括这样的计算机程序指令,所述计算机程序指令能够:
向分区指派优先级;
检测分区的故障处理器的检错停机;
检索所述故障处理器的状态;
由系统管理程序用替换处理器替换所述故障处理器,其中,所述替换处理器来自具有比所述故障处理器的分区的优先级更低的优先级的分区;以及
将所检索的所述故障处理器的状态指派为所述替换处理器的状态。
8.根据权利要求7所述的计算机程序产品,其中,所述信号承载媒体包括可记录媒体或包括传输媒体。
9.根据权利要求7或8所述的方法,其中:
所述故障处理器被指派给专用分区或被指派给虚拟处理器池;
最低优先级分区是专用分区;以及
替换所述故障处理器包括终止所述最低优先级分区。
10.根据权利要求7到9中任一个所述的计算机程序产品,其中:
所述故障处理器被指派给专用分区或被指派给虚拟处理器池;
具有比所述故障处理器的分区更低的优先级的分区包括一个或更多共享处理器分区;以及
替换所述故障处理器包括:终止具有比所述故障处理器的分区更低的优先级的足够数量的共享处理器分区以释放替换处理器,或者包括:
调拨过度地运行具有比所述故障处理器的分区更低的优先级的一个或更多共享处理器分区,以在不终止分区的情况下释放替换处理器。
CN200680035837.3A 2005-09-30 2006-09-07 向支持多逻辑分区的计算机中的逻辑分区指派处理器的方法和系统 Active CN101273334B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/241,695 2005-09-30
US11/241,695 US7493515B2 (en) 2005-09-30 2005-09-30 Assigning a processor to a logical partition
PCT/EP2006/066144 WO2007039397A1 (en) 2005-09-30 2006-09-07 Assigning a processor to a logical partition and replacing it by a different processor in case of a failure

Publications (2)

Publication Number Publication Date
CN101273334A true CN101273334A (zh) 2008-09-24
CN101273334B CN101273334B (zh) 2012-05-23

Family

ID=37440696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200680035837.3A Active CN101273334B (zh) 2005-09-30 2006-09-07 向支持多逻辑分区的计算机中的逻辑分区指派处理器的方法和系统

Country Status (5)

Country Link
US (2) US7493515B2 (zh)
EP (1) EP1943590B1 (zh)
JP (1) JP4841632B2 (zh)
CN (1) CN101273334B (zh)
WO (1) WO2007039397A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750354A (zh) * 2018-07-24 2020-02-04 中国移动通信有限公司研究院 一种vCPU资源分配方法、装置和计算机可读存储介质

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7478272B2 (en) * 2005-09-30 2009-01-13 International Business Machines Corporation Replacing a failing physical processor
EP1892625B1 (en) * 2006-08-09 2018-07-11 Red Bend Software Finer grained operating system scheduling
US8473460B2 (en) * 2006-11-21 2013-06-25 Microsoft Corporation Driver model for replacing core system hardware
US7934121B2 (en) 2006-11-21 2011-04-26 Microsoft Corporation Transparent replacement of a system processor
KR100930576B1 (ko) * 2006-12-04 2009-12-09 한국전자통신연구원 가상화 기반 고가용성 클러스터 시스템 및 고가용성클러스터 시스템에서 장애 관리 방법
US8112524B2 (en) * 2007-01-15 2012-02-07 International Business Machines Corporation Recommending moving resources in a partitioned computer
JP4705051B2 (ja) 2007-01-29 2011-06-22 株式会社日立製作所 計算機システム
US8086906B2 (en) 2007-02-15 2011-12-27 Microsoft Corporation Correlating hardware devices between local operating system and global management entity
JP5032191B2 (ja) * 2007-04-20 2012-09-26 株式会社日立製作所 サーバ仮想化環境におけるクラスタシステム構成方法及びクラスタシステム
JP4458119B2 (ja) * 2007-06-11 2010-04-28 トヨタ自動車株式会社 マルチプロセッサシステム及びその制御方法
US20090055831A1 (en) * 2007-08-24 2009-02-26 Bauman Ellen M Allocating Network Adapter Resources Among Logical Partitions
US20090077550A1 (en) * 2007-09-13 2009-03-19 Scott Rhine Virtual machine schedular with memory access control
JP5151509B2 (ja) * 2008-01-30 2013-02-27 日本電気株式会社 仮想マシンシステム及びそれに用いる仮想マシン分散方法
JP2009252204A (ja) * 2008-04-11 2009-10-29 Hitachi Ltd 計算機の運用管理システム及び運用管理方法
JP5161696B2 (ja) * 2008-08-07 2013-03-13 株式会社日立製作所 仮想計算機システムおよび仮想計算機システムにおけるエラー回復方法ならびに仮想計算機制御プログラム
EP2374062B1 (en) 2008-12-12 2012-11-21 BAE Systems PLC An apparatus and method for processing data streams
US20100229175A1 (en) * 2009-03-05 2010-09-09 International Business Machines Corporation Moving Resources In a Computing Environment Having Multiple Logically-Partitioned Computer Systems
US8572432B1 (en) * 2009-04-02 2013-10-29 Xilinx, Inc. Method and apparatus for processing an event notification in a concurrent processing system
US8489797B2 (en) * 2009-09-30 2013-07-16 International Business Machines Corporation Hardware resource arbiter for logical partitions
US8505020B2 (en) * 2010-08-29 2013-08-06 Hewlett-Packard Development Company, L.P. Computer workload migration using processor pooling
CN102102975B (zh) * 2011-01-13 2012-09-05 中国人民解放军国防科学技术大学 中低速磁浮列车的悬浮间隙传感器
JP5817308B2 (ja) * 2011-08-04 2015-11-18 富士通株式会社 サーバ、サーバシステムおよびサーバの冗長切り替え方法
US9052932B2 (en) 2012-12-17 2015-06-09 International Business Machines Corporation Hybrid virtual machine configuration management
US9210032B2 (en) 2013-05-06 2015-12-08 International Business Machines Corporation Node failure management
JP6135403B2 (ja) * 2013-08-27 2017-05-31 富士通株式会社 情報処理システム、情報処理システムの障害処理方法
US10114825B2 (en) * 2014-03-14 2018-10-30 Sap Se Dynamic resource-based parallelization in distributed query execution frameworks
US10395195B2 (en) * 2016-01-08 2019-08-27 International Business Machines Corporation Provisioning virtual machines to optimize application licensing costs
US10127068B2 (en) 2016-06-30 2018-11-13 Amazon Technologies, Inc. Performance variability reduction using an opportunistic hypervisor
JP7151631B2 (ja) * 2019-06-11 2022-10-12 株式会社デンソー 車両用制御装置、車両用表示システム、及び車両用表示制御方法
US11900174B2 (en) * 2022-06-22 2024-02-13 Dell Products L.P. Processing unit virtualization with scalable over-provisioning in an information processing system

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02123455A (ja) * 1988-11-02 1990-05-10 Hitachi Ltd マルチプロセッサシステムの再構成方法
JP3196004B2 (ja) * 1995-03-23 2001-08-06 株式会社日立製作所 障害回復処理方法
JP2000181890A (ja) * 1998-12-15 2000-06-30 Fujitsu Ltd マルチプロセッサ交換機及びその主プロセッサ切替方法
US7140020B2 (en) * 2000-01-28 2006-11-21 Hewlett-Packard Development Company, L.P. Dynamic management of virtual partition computer workloads through service level optimization
JP2002202959A (ja) * 2000-12-28 2002-07-19 Hitachi Ltd 動的な資源分配をする仮想計算機システム
JP4119162B2 (ja) * 2002-05-15 2008-07-16 株式会社日立製作所 多重化計算機システム、論理計算機の割当方法および論理計算機の割当プログラム
US7065641B2 (en) * 2002-06-13 2006-06-20 Intel Corporation Weighted processor selection apparatus and method for use in multiprocessor systems
US7451183B2 (en) * 2003-03-21 2008-11-11 Hewlett-Packard Development Company, L.P. Assembly and method for balancing processors in a partitioned server
US7275180B2 (en) * 2003-04-17 2007-09-25 International Business Machines Corporation Transparent replacement of a failing processor
US7225356B2 (en) * 2003-11-06 2007-05-29 Siemens Medical Solutions Health Services Corporation System for managing operational failure occurrences in processing devices
US7426657B2 (en) 2004-07-09 2008-09-16 International Business Machines Corporation System and method for predictive processor failure recovery

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110750354A (zh) * 2018-07-24 2020-02-04 中国移动通信有限公司研究院 一种vCPU资源分配方法、装置和计算机可读存储介质
CN110750354B (zh) * 2018-07-24 2023-01-10 中国移动通信有限公司研究院 一种vCPU资源分配方法、装置和计算机可读存储介质

Also Published As

Publication number Publication date
US20090106586A1 (en) 2009-04-23
US20070079102A1 (en) 2007-04-05
CN101273334B (zh) 2012-05-23
WO2007039397A1 (en) 2007-04-12
JP4841632B2 (ja) 2011-12-21
US7493515B2 (en) 2009-02-17
JP2009510572A (ja) 2009-03-12
EP1943590A1 (en) 2008-07-16
US7958392B2 (en) 2011-06-07
EP1943590B1 (en) 2013-03-06

Similar Documents

Publication Publication Date Title
CN101273334B (zh) 向支持多逻辑分区的计算机中的逻辑分区指派处理器的方法和系统
CN100580631C (zh) 用于替换故障物理处理器的方法和装置
CN1316362C (zh) 重定位在多线程计算机中共享的计算机数据的设备和方法
US8230425B2 (en) Assigning tasks to processors in heterogeneous multiprocessors
CN1834950B (zh) 具有活动和非活动执行核心的多核处理器
US10333859B2 (en) Multi-tenant resource coordination method
JPH03147047A (ja) 入出力チャネル経路上の負荷を均衡させる方法及びコンピュータ・システム
JPS6130310B2 (zh)
EP1914632A1 (en) Schedule control program and schedule control method
JPH0689221A (ja) コンピュータ・システムにおけるメモリ管理方法及び装置
CN1337623A (zh) 通过资源恢复得到系统最优可用性的方法和系统
US8255639B2 (en) Partition transparent correctable error handling in a logically partitioned computer system
CN108959526B (zh) 日志管理方法以及日志管理装置
CN100590596C (zh) 多节点计算机系统和用于监视其性能的方法
CN103838521B (zh) 一种数据处理方法及装置
US8296552B2 (en) Dynamically migrating channels
US20200285510A1 (en) High precision load distribution among processors
JP5116304B2 (ja) 未返還待機リソース使用率を確定するためのシステム
US11941450B2 (en) Automatic placement decisions for running incoming workloads on a datacenter infrastructure
US8614799B2 (en) Memory paging

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant