CN1503100A - 对插入带电机架的模块分配电源的设备、方法和程序产品 - Google Patents

对插入带电机架的模块分配电源的设备、方法和程序产品 Download PDF

Info

Publication number
CN1503100A
CN1503100A CNA2003101183213A CN200310118321A CN1503100A CN 1503100 A CN1503100 A CN 1503100A CN A2003101183213 A CNA2003101183213 A CN A2003101183213A CN 200310118321 A CN200310118321 A CN 200310118321A CN 1503100 A CN1503100 A CN 1503100A
Authority
CN
China
Prior art keywords
module
structure type
heat
server
plug
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2003101183213A
Other languages
English (en)
Other versions
CN100378616C (zh
Inventor
M
杰弗瑞·M·弗兰克
��E��Լ��ѷ
唐纳德·E·约翰逊
S
迈克尔·S·罗林斯
R����º�ķ
戴维·R·伍德汉姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1503100A publication Critical patent/CN1503100A/zh
Application granted granted Critical
Publication of CN100378616C publication Critical patent/CN100378616C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • G06F13/4063Device-to-bus coupling
    • G06F13/4068Electrical coupling
    • G06F13/4081Live connection to bus, e.g. hot-plugging

Abstract

当一个插件和/或互连装置插入已供电或带电的服务器的机架,这种操作被称为热插。在电源应用于该热插插件和/或互连装置之前,把已经安装的插件和/或互联装置的结构类型与新热插的插件和/或互联装置的结构类型相互关联。根据该关联的结果,允许或拒绝给热插的插件和/或互联装置供电。

Description

对插入带电机架的模块分配电源的设备、方法和程序产品
技术领域
本发明一般涉及通信网络,并且特别涉及被称作“服务器”的这类网络设备。
背景技术
把服务器用作为在通信网络中的装置是本领域所公知的技术。服务器是使得文件、数据库、打印、传真、通信或者其他服务可以被访问该服务器所服务的网络的客户终端/站所获得的设备。当该服务器允许客户终端/站访问外部通信网络时,其有时被称为一个网关。可以使用不同大小、形状以及种类的服务器。服务器可能遍布在一个网络或集中在中央数据中心。尽管,这些差异必然有内在的问题,该问题是该服务器以可接受和可靠的方式工作所必须解决的问题。
或许,与服务器相关的一个最紧迫的问题是可管理性,尤其是对于机架上安装的服务器的可管理性。这种服务器中的可管理性的一个方面涉及元件和电源管理之间的兼容性。特别是,在哪一个配置周期的接合点上施加电源或允许把电源施加到元件上。不能够在最佳的接合点施加电源会引起元件损坏以及服务器停机。
在过去配置中,一个典型的服务器集合将连接到需要由操作员手动敷设以及进行兼容性检测的交换机或集线器。一旦这些手动的工序完成,电源将被施加到该服务器以及相应的交换机。
由于有可能由于人为错误而损坏设备,因此手动兼容性检测以及手动敷设是不可取的。另外,由于与雇用服务技术员以执行上述手动任务相关的成本导致运营的成本可能较高。
考虑到以上问题,需要确定一种更有效率的系统以及方法,以确保电源用于服务器中的互联部件之前,所述部件之间相互兼容。
发明内容
本发明的一个优点是模块的兼容性自动确定,而不需要人为的干涉。
本发明的另一个优点是因为不需要人为的干涉,排除了由于人为错误造成的设备损坏的可能性。
本发明还有另一个优点是排除了由于聘请技术员而导致运营成本上的增加。
本发明还有另一个优点是服务器可以放置于难以到达的位置。因为执行测试的系统内建于服务器中,并且照初始化例程的一部分来运行。
本发明使用已经在服务器中已经存在的元件和基础结构来执行兼容性测试以及给模块供电。特别地,最好在管理模块(MM)上的一个处理器被编程为确定模块的结构类型和提供在模块和通信干线或外部网络之间的互连的连接器的结构类型。一旦信息采集完毕,该处理器确定基于允许大多数模块或连接器通电的配置的主导结构类型。该处理器使得电源施加到作为主导结构类型的所有模块和连接器。例如,如果该主导结构类型是以太网,那么任何把其本身标识为以太网以及用以太网协议连接的模块将被激活。同样地,将其本身标识为以太网的连接器也由电源激活。
一个插件和/或连接器(以下为机架互连装置)通常将插入一个带电或已通电的机架。这种操作通常称为热插(hot plugging)该模块。在允许给该插件供电或该互连结构装置加电之后,该控制器把该插件和机架互连装置的结构类型与被热插的模块的结构类型相关联,并且根据关联的结果允许或不允许给该模块加电。
附图说明
图1显示体现本发明的思想的服务器结构图。
图2显示一个在处理器上执行以实现本发明的思想的程序的流程图。
图3显示该处理器的方框图。
图4显示当一个插件插入一个带电或正在工作的机架时应用的一个程序的流程图。
图5是本发明的一个服务器插件系统的正面、顶部以及右侧的分解透视图。
图6是该服务器插件系统的后部的后面、顶部以及左侧的透视图。
图7是该服务器插件系统的管理子系统的示意图。
图8是该服务器插件系统的管理功能的拓扑图。
图9是交换模块与处理器插件互联的结构图。
具体实施方式
下文的说明以数据通信网络、如服务器或类似网络装置、以及用于在网络中传输信息的协议的知识为前提。同样地,将不在这里给出关于所有所列举条目的一般信息。可以说相对于这些条目的背景信息可以在文献或以下站点以及其后继站点上找到。该站点包括:
http://www.pc.ibm.com/us/eserver/xseries/bladecenter_family.html?ca=xSeries&met=ibmblade&me=A
http://www.carrieraccessbilling.com/telecommunications-glossary-s.asp
图1显示体现本发明的思想的服务器100的方框图。如以上说明以及在以下更多详述中描述的,本发明涉及服务器的配置以及对已配置的子系统施加电源,使得在子系统或用外部网络或通信干线之间的通信成为可能。该服务器100包括机架101,其中安装有处理器模块(PM)102至PM N。标为SW A到SW D的多个交换机(SW)也安装在该机架中。每个交换机有多个端口将其与外部网络互联,并且多个端口把每个交换机通过中平面(mid-plane)110连接到多个处理器模块。在本申请中所用的“处理器模块”以及“处理器插件”或“插件”可以互换使用。
仍然参见图1,管理模块(MM)112通过I2C总线连接到交换机SW A到SW D中的每一个交换机。该管理模块112也通过485总线连接到每个处理器模块PM102到PM N。每一个处理器模块有一个485端口,它从被标为P102”到PN”的板载处理器(P)上采集信息并且在485总线上把该信息转发到管理模块112。同样地,每个交换机SW A到SW D都有一个I2C端口,它从交换模块收集或采集低级信息以及状况,并且在I2C总线上转发到管理模块。
仍然参见图1,该中平面110以下被称为高速互联模块110提供在处理器模块以及交换机之间的连通性。为了说明的目的,图1中示出处理器模块与到所连接的交换机之间的互连为配线连接。然而,这种显示方法仅仅用于说明的目的,因为在实际的机器中,所有的配线是在该高速互联模块110的支持部件上用印刷电路或某些其他适当的技术完成的。在该互联模块上也提供连接器(未在图中显示)并且该交换机与该处理器模块都插入互联模块上的各个连接器。同样应该注意在处理器模块与交换机之间的配置(即,互联)仅仅作为例子,并不应该解释为对本发明范围的限制。因为完成该连接的方法需要考虑到本发明范围以外的因素。然而,为了公开本发明的目的,处理器模块102有两个端口,其中一个端口连接到SW A,另一个连接到SW B。同样地,PM 104、PM 106、PM 108到PM N都有两个端口,均通过通信链接连接到SW A以及SW B。其他PM从PM 110到PM N将也有两个端口分别连接到SW A以及SW B。但是,为了不混淆该附图,该连接未示出。
仍然参见图1,每个处理器模块可以提供一个子卡(DC)。该子卡附件是可选的。因此,尽管图形显示每个PM都有一个子卡,但这仅仅用于图解。每个子卡及其关联的处理器模块有适当的连接器以实现匹配。如图所示,PM 102具有与它关联的DC 102’。类似地,PM 104具有与它关联的DC 104’,并且对于服务器100中的其他处理器模块及其关联子卡也类似。从DC 102’到DC N’的每个子卡有两个端口,其中每一个将被分别连接到SW C以及SW D。同样应该注意每个子卡上的两个输出端口仅仅作为例子,并不是对本发明的范围的限制。每个处理器模块也具有一个处理器,标为P102”到 PN”。在每个处理器模块上的处理器的功能包括电源管理(即,激活或停止在其所属的PM上的电源)。该板载处理器同样在其相关的PM上采集其他信息,如温度等等,并且通过485总线与管理模块上的处理器112’通信。如以下将说明的,通过在485总线上的通信,在管理模块中的处理器112’得到关于存在于服务器100中的PM模块的类型的信息。类似地,从SW A到SW B的信息被交换,并且I2C总线与在该管理模块112中的处理器112’连接。该处理器112’使用所采集的信息以确定该配置的主导结构类型。如在这个文件中用到的主导结构类型涉及允许启动最多的PM和SW的SW和PM类型。
仍然参见图1,从SW A到SW D的交换机可以是以太网、光纤通道交换机、Infiniband或任何公知类型的提供与外部网络的连接性的交换机或连接器。图1中的图解也显示每个处理器模块(PM)有通过交换机A以及交换机B的连通性。类似地,每个子卡有通过交换机C以及交换机D的连通性。管理模块112提供用于服务器100的单一控制点。处理器112’是一个执行软件程序的配置处理器(将在下文描述),从485总线上的每个PM以及I2C总线上的每个交换机采集信息,分析该信息,确定PM到交换机的兼容性,将电源应用于适当的交换机并允许将电源应用于与适当的交换机兼容的适当的处理器模块。换句话说,本发明的配置部件自动检测在该高速互连接构110的每一个端上的元件(PM以及SW)并且在允许它们通电之前确保它们是兼容的。
图2显示在处理器112’中执行的软件程序的流程图。该处理器112’可以是依照本发明的思想编程的任意的机架处理器。在本发明的一个实施例中,该处理器是由IBM公司开发并销售的PowerPC。当然,在不违背本发明的思想的前提下,可能使用其他类型的常规处理器。首先描述如该流程图显示的程序的大方框,接着描述小方框。该程序在开始方框202开始,并且进行到大方框204中,该方框通常确定结构类型,该结构类型可以是以太网、光纤网等等。该程序然后进行到大方框206中,其中该程序确定导致启动多数插件/交换机的结构配置。应该注意依照本发明思想的配置程序的主核心是启动最多的与处理器模块关联的子卡以及交换机,这将在路由器中提供最大的通信路径
仍然参见图2,该程序从方框206选择主导结构类型方框208,并且进行到大方框210中,该方框允许启动所选择的兼容处理器模块交换集合并进行到方框212中,该程序在此停止或退出。
仍然参见图2,大方框204包括方框214,该程序在此确定是否有一个模块已安装或已连接在该机架的一个所选择的插槽中。如果该响应为“否”,该程序进入方框216,在此检查添加的模块是否存在。如果该响应为“是”,该程序退出方框216,沿着该“是”通路再次进入方框214。如果从方框214的测试的结果退出,该程序沿着该“是”通路进入方框218,该程序在此查询将其结构类型提供给它的模块。如在此使用的,结构类型意味着由该模块支持的通信的类型。如上文所述,此结构类型可能是以太网、光纤网或任意适当的模块类型。该查询由图1中485总线上的处理器112’完成。对于交换机,该查询在I2C总线上完成。每个处理器模块对该处理器的响应由板载处理器102”到 PM N”提供。来自交换机的响应通过每个交换机中的板载控制器(未示出)从放置在每个交换机的存储器的所选择部分中的信息获得。
再次参见图2,如果方框216中没有更多的模块,该程序退出并沿着“否”进入大方框206。在大方框206中,该程序利用所采集的信息确定该主导或所指定的结构类型208。如上文所述,该结构类型被选择,使得最多的处理器模块以及交换机被通电。该程序从方框208进行到方框220中,该程序在此确定一个模块是否与所选择的结构类型兼容(方框208)。如果该模块与所选择或所指定的结构类型兼容,该程序进入方框222,在此停止该模块的电源。对于交换机,如果该交换机与指定的结构类型不匹配,其将不被开启。对于方框220,如果该模块与所指定的结构类型兼容,该程序进行到方框224。对于处理器模块或插件,设置启动特定的处理器模块的电源许可。该设置以任何公知的适当的方法完成,如在该处理器模块中的寄存器中设置一个比特。依靠该比特的设置,该处理器例如P102”到PN”到所关联的模块的电源。对于交换机,该管理模块将启动交换机的电源。该程序从方框224进行到方框226中,在此确定附加的模块是否存在。如果该响应是“是”,该程序返回模块222并且执行先前所描述的处理。如果该响应是“否”,该处理器通过该停止方框212退出。
在已描述依照本发明思想的一个执行过程之后,现在将给出对于一个预先确定的配置如何应用本发明的一个例子。
对于该例子将假设如下交换机配置。对于图1的SW A、SW B、以及SW C被假定为以太网交换机。SW D被假设为一个光纤通道交换机。PM102、PM104、PM106以及PM108被假定为以太网结构类型。子卡(DC)102’被假设为以太网子卡。子卡104’被假设为停用或不可用的。换句话说,子卡104’不在网络中。子卡106’以及子卡108’假设为光纤子卡。在MM112中的处理器P112’发出一个查询消息,对例如处理器模块和交换机这样的每个部件查询它们的结构类型。处理器P102”、P104”、P106”以及P108采集这个信息并且由485总线传递给正在请求的处理器P112’。类似地,处理器112’访问每个交换机中存储结构类型信息的存储区,并且在I2C总线上获得该信息。利用在P112’中的信息,基于将提供可激活的最多的处理器模块和交换机的主导媒体类型,作出判断。在本例中,该结构类型可以是以太网。因此,所有以太网类型的处理器模块以及子卡将准予开启。类似地,所有以太网类型的交换机将由管理模块112启动。由本例,PM102、PM104、PM106以及PM108将被启动。类似地,DC 102’也将被启动。由于SW A、SW B、SW C是以太网交换机,因此它们也被启动。然而,光纤的DC 108’和DC 106’不被启动。因此,它们将仍在关闭状态。类似地,作为光纤交换机的SW D将仍在关闭状态。
图3描绘用于可执行图2所示程序的处理器的示意图。这个处理器包括连接ROM310、CPU308、RAM306以及I/O控制器304的系统总线302。该CPU308包括操作系统、驱动器以及应用程序。其中一个应用程序将为从图2提出的流程图产生的一个程序。用于CPU的指令存储在ROM310中。RAM306作为一个暂时存储器,其用于CPU以及存储在该I/O控制器上输入到RAM306的信息。该I/O控制器304也形成用于分别处理器模块和交换机通过由485总线和I2C总线提供的信息的接口。应该注意图3中处理器的显示仅仅是例子,并且任何类型的处理器都可能用于执行图2提出的处理步骤。
概而言之,本发明解决了一个有多插件以及互联连接器的机架中的可管理的问题。一个互连连接器包括但不限制以太网交换机、光纤通道交换机或串行端口集中器(Serial port concentrator)。该机架中每个插件或处理器模块(PM)有一个子卡,其将在该互连连接器上通信。为了启动的兼容性,该子卡、PM以及该互连连接器必须是同种类型的。最初,互连连接器以及PM的类型和数量都是未知的。该管理模块(系统管理模块)在一个总线上与每个PM通信以确定可能存在的连接类型和子卡。该管理模块也在一个总线上与每个互连连接器通信以确定该互连连接器的类型。该管理模块将接着计算哪个服务器以及互连连接器将被允许通电或启动。该管理模块将使用该总线与每个允许通电并且使用该互连结构的PM进行通信,并且与每个互连连接器通信以启动PM。这使得互连结构以仅仅兼容的元件可以在互连结构上通信。这是用于插件服务器的机架的理想方案,因为其提供一个可以用于多个用途的高速互连结构的构造。
本说明书到目前为止涉及到一个冷起动系统。如本申请中所用,一个冷起动系统是一个还未在任何处理器模块或互连连接器上施加电源的系统。
本文档剩下的部分涉及一个插件和/或互连装置插入一个通电或带电的服务器插件机架的情况。这也被称为热插。
当一个插件插入一个带电机架,该插件可能安装了不兼容的互连结构硬件。如果该互连结构装置不兼容,则该插件不允许开启。在某些情况下,该硬件可能会出现物理损坏。
为了防止损坏,检查该插件并且测试该插件上已安装的互连结构硬件。此时,基于保存在当前已安装的插件以及当前已安装的服务器插件机架互连装置上的信息,做一个允许启动新插件的决定。
特别地,关于当前安装在该服务器插件机架中的插件以及安装在该服务器插件机架中的互连结构硬件的信息由该服务处理机采集并存储。当一个新插件或一个新互连结构装置插入该机架,该服务处理机将查询该新装置的信息。该板载结构接口、可选结构接口、所有现有的插件以及该新插入的插件的电源状况被相互比较,并且,该机架中安装的可选互连结构的类型也一样。
连同该机架中的互连结构装置一起插入一个热服务器插件机架中的带有一个互连结构装置的第一插件将指示该机架电源许可的方案。例如,如果该机架中的一个互连结构硬件装置是A类型并且一个有A类型选项卡的插件被允许通电,则未来所有的希望启动的插件必须也有A类型选项卡、没有安装选项卡或者它们的选项卡不能与A类型选项结构冲突。类似地,如果插件在一个机架互连结构装置之前启动,该插件配置将指示允许启动该机架互连结构装置。如果存在不兼容,该新插件或新机架互连结构装置将不允许启动并且把该不兼容装置通报给用户。
图4显示一个在服务处理机PM112’(图1)上执行的程序的流程图,该程序处理热插模块(插件和/或互连装置)的电源许可。该程序包括方框402至412。在方框402中,该程序采集关于所有已安装的插件以及互连装置的信息(如结构类型)。在方框404中,热插一个插件。如果该新插件的结构类型与已安装的插件相同(方框408),这块热插模块允许通电(方框410)。否则,拒绝通电(方框412)。
图5至9以及接下来的描述给出一个服务器插件系统的概观,本发明以上描述的部分在该系统中实现。
图5是一个服务器插件系统的前面、顶部以及右侧的分解透视图。参见此图,主机架CH1容纳该服务器插件系统的所有元件。多达14个处理器插件PB1到PB14(或其他插件,如存储插件)可热插入机架CH1的前部中的14个插槽中。术语“服务器插件”、“处理器插件”,或者只是“插件”的使用遍及本说明书以及权利要求书,但应该理解这些术语不限于仅仅执行“处理器”或“服务器”功能的插件,而也包括执行其他功能的插件,如存储插件,其代表性地包括硬盘驱动器以及以存储数据为基本功能的存储器。
处理器插件提供处理器、存储器、硬盘存储以及行业标准服务器的固件。另外,它们包括通过一个控制面板对键盘、视频以及鼠标(“KVM”)的选择,一个板载服务处理器,以及对媒体盘中的软盘以及CD-ROM的存取。一个子卡通过一个板载PCI-X接口连接并且通常提供到交换模块SM3以及SM4(在下文描述)的额外的高速链接。每个处理器插件也有一个带5个发光二极管以表示当前状况的前置面板,加上四个按钮开关,用于通/断电、对处理器插件的选择、复位以及用于本地控制的存储器更新的NMI(非屏蔽中断)。
插件可能被“热插拔”而不影响该系统中其他插件的运转。一个服务器插件一般以一个单插槽卡(394.2mm×226.99mm)的形式来实现;然而,在某些情况中,一个单处理器插件可能需要两个插槽。一个处理器插件可以使用任何微处理器工艺,只要其符合该服务器插件系统的机械和电气接口、以及电源和冷却要求。
为了冗余,处理器插件有两个信号以及电源连接器;一个连接到中平面MP(在下文描述)的相应的插槽的上连接器,另一个连接到该中平面相应的下连接器。处理器插件接口通过如下中平面接口:1)千兆以太网(每个插件带两个,必须的);2)光纤通道(每个插件带两个,可选的);管理模块串行链接;4)VGA模拟视频链接;4)键盘/鼠标USB链接;5)CD-ROM以及软盘驱动器(“FDD”)USB链接;6)12V直流电源;以及7)混合控制信号与服务器插件系统中的其他元件相接。这些接口提供与服务器插件系统中的诸如管理模块、交换模块、CD-ROM以及FDD的其他元件进行通信的能力。这些接口在中平面上都有两个以提供冗余。一个处理器插件一般支持从媒体盘CD-ROM或FDD、网络(光纤通道或以太网)或其本地硬盘引导。
一种媒体盘MT包括一个软盘驱动器以及一个CD-ROM驱动器,这可以与14个插件中的任何一个连接。该媒体盘也容纳一个接口板,上面装有接口发光二极管,一个用于测量入口空气温度的热敏电阻,以及4端口USB控制集线器。系统级接口控制由供电、位置、温度、信息以及普通侦错发光二极管和USB端口组成。
中平面电路板MP大约安置在机架CH1的中央并且包括两排控制器;顶排的包括控制器MPC-S1-R1到MPC-S14-R1,以及底排的包括MPC-S1-R2到MPC-S14-R2。因此,14个插槽中的每一个插槽包括一对中平面连接器,其中一个位于另一个上方(例如,连接器MPC-S1-R1和MPC-S1-R2),并且每一对中平面连接器配合在每个处理器插件后缘的一对连接器(在图5中不可见)。
图6是该服务器插件系统的后部的后面、顶部以及左侧的透视图。参见图5和6,一个机架CH2容纳多种用于冷却、供电、控制以及切换的可热插元件。机架CH2滑入主机架CH1的后面并锁住。
两个可热插的风扇BL1以及BL2包括向后弯曲的叶轮风扇并且给服务器插件系统元件提供额外的冷却。气流从机架CH1的前部流到后部。从PB1至PB4的每个处理器插件一个前部窗格用于吸气,并且基于散热片的低侧流室通常用于冷却插件中的处理器。所有通过该系统机架的气流大约有300CFM在0.7英寸H2O静态压降。在风扇故障或移除的情况下,剩下的风扇转速自动提高以保持必须的气流,直到装上替换的单元。风扇速度控制也通过一个长期监测入口气温的热敏电阻来控制。服务器插件系统元件的温度也被监控,并且风扇的速度将响应由多种温度传感器报告的正在上升的温度水平而提高。
从PM1至PM4的四个可热插电源模块提供用于处理器插件以及其他元件的直流工作电压。其中一对电源模块给所有管理模块以及交换模块,加上插入插槽1-6的所有插件提供电源。另一对电源模块给插入插槽7-14的所有插件提供电源。在每对电源模块中,一个电源模块作为当第一电源模块出现故障或被移除时的备用电源模块。因此,至少必须两个活动的电源模块给一个满载并配置的机架供电,该机架装有14个处理器插件、4个交换插件、2个风扇以及2个管理模块。但是,需要四个电源模块提供完全的冗余以及备用容量。该电源模块被设计为交流输入电压范围在200V AC到240V AC之间,50/60Hz的情况下运转,并且使用一个IEC 320 C14阳设备连接器。该电源模块给该中平面提供+12V直流输出到中平面,所有服务器插件系统的组件从中平面得到它们的电能。两条+12V直流中平面电源总线用于冗余并且执行冗余的电源模块之间的输出负载的有效电流共享。
管理模块MM1到MM4是提供诸如控制、监控、警告、重新启动以及诊断之类基本管理功能的可热插元件。管理模块也提供管理共享资源所必须的其他功能,如在处理器插件中切换共有的键盘、视频以及鼠标信号的能力。
图7是该服务器插件系统的管理子系统的原理图。参见此图,每个管理模块有一个单独的以太网链接到每个交换模块SM1至SM4。因此,管理模块MM1通过以太网链接MM1-ENet1到MM1-ENet4,链接到交换模块SM1至SM4,并且管理模块MM2通过以太网链接MM2-ENet1到MM2-ENet4链接到交换模块。另外,该管理模块也通过两条公知的串行I2C总线SM-I2C-BusA以及SM-I2C-BusB与交换模块连接,该总线提供管理模块与交换模块间的“频带外”通信。类似地该管理模块也通过两条串行I2C总线PMI2C-BusA以及PMI2C-BusB连接到电源模块PM1至PM4。还有两条I2C总线Panel-I2C-BusA以及Panel-I2C-BusB连接到媒体盘MT以及后面板。风扇BL1以及BL2是在单独的串行总线Fan1和Fan2上控制的。两种公知的RS485串行总线RS485-A和RS485-B连接到服务器插件PB1至PB14用于管理模块与服务器插件间的“频带外”通信。
图8是该服务器插件系统的管理功能的拓扑图。参见图7和8,这两个管理模块中每一个都有一个100Mbps以太网端口,这要被附加在一个专用的、安全的服务器上。该管理模块固件支持用于直接或远程访问的一个网络浏览器接口。每个处理器插件有一个专门的服务处理机(SP)用于发送命令到管理模块和从管理模块接收命令。与交换模块相关的数据端口可以用于访问处理器插件,用于映像部署(imagedeployment)和应用管理。一个管理和控制协议允许该管理模块鉴别单独的插件,这作为插件激活操作的一部分。一个管理模块也可以发送警报到一个远程控制台以表示状况的改变,如插件或模块的移除或增加。一个管理模块也提供对交换模块的内部管理端口和其他主机架子系统(电源、冷却系统、控制面板以及媒体驱动器)的访问。
该管理模块通过该频带外串行总线与每个处理器插件服务处理机通信,以一个管理模块作为主机并且该处理器插件服务处理机作为从机。为了冗余,有两条串行总线(每一个中平面连接器具有一条总线)与每个处理器插件服务处理机通信。根据活动管理模块发出的信号的状态,该处理器插件负责激活到中平面顶部或底部的连接器的恰当的接口。当安装了两个管理模块时,在插槽1中的模块将正常地承担活动管理任务,而在插槽2中的模块将作为备用模块保留。在该机架子系统初始化后,管理模块故障或移除的情况下,该处理器插件以及交换子系统的运转不受影响。因此,如果两个管理模块都不活动或被移除,该服务器插件系统的元件将继续运行,但是机架配置不能改变。用于在每个顶部以及底部中平面连接器上的每条插槽的地址是硬线连接的,并且该地址由一个处理器插件的服务处理机用于确定哪个处理器插件在该串行总线上被寻址。
四个交换模块SM1至SM4中的每一个模块有一个专门的100Mbps以太网链接到两个管理模块MM1以及MM2。这提供到每个交换模块的仅仅用于控制和管理目的一个安全高速通信路径。该I2C串行链接由管理模块用于在内部提供交换模块的控制,并且采集系统状况和厂商产品数据(“VPD”)信息。为了达到此目的,该交换模块中的不同的控制以及数据区,如状态和诊断记录以及VPD信息可由管理模块固件访问。一般地,活动的管理模块可以探测系统中的每个插件、电源模块、风扇以及中平面的存在情况、数量、类型以及修正级别,并且可以探测无效或不被支持的配置(例如,带光纤子卡的处理器插件连接到以太网交换模块)。此功能依赖于每个子系统中的VPD信息以及从不同的硬件接口发出的信号或通过服务处理机协议的通信。
图9是交换模块与处理器插件互连的方框图。参见此图,SW1至SW4的每一个交换模块包括四个外部千兆端口。例如,交换模块SW1包括外部千兆端口XGP1-SW1至XGP4-SW1。每个处理器插件包括四个内部的千兆端口通过该中平面连接器把处理器插件连接到四个交换模块中的每一个模块。例如,处理器插件PB1包括四个内部千兆端口IGP1-PB1至IGP4-PB1。另外,每个管理模块通过以太网链接,连接到交换模块。
该以太网交换模块是可热插元件,其为该服务器插件系统提供以太网交换能力。交换模块的主要目的是提供在处理器插件、管理模块以及外界网络基础之间的以太网互连性。根据应用,该外部以太网接口可以被配置以适应对带宽和功能的多种需求。当一个第二以太网交换模块被建议用于冗余时,一个以太网交换模块包括在基础系统配置中。每个处理器插件有一个专门的到两个交换模块中的每一个模块的1000Mbps(1Gbps)全双工SERDES链接,并且每个交换模块有四个外部1Gbps(RJ45)端口用于连接到外部网络基础结构。
光纤通道(FC)是用于在一组服务器中共享远程存储装置的一个行业标准联网方案。每个处理器插件包括一个连接器以接受一个包含两个光纤通道端口的光纤通道子板,其中每个端口有2Gb,用于到双光纤通道交换模块的连接。光纤通道信号的路由发生在通过中平面到服务器插件机架的后部的插槽3和4中的光纤通道交换模块。每个光纤通道交换模块都是可热插的,并不中断插件或机架的运转。两个光纤通道端口的路由是这样的:从每个处理器插件的一个端口线路连接到一个光纤通道交换模块,并且另一个端口线路连接到另一个光纤通道交换模块以提供冗余。每个光纤通道交换模块有两个外部2Gb端口用于连接外部光纤通道交换和存储基础设备。这种可选方案允许14个处理器插件中的每一个插件同时访问一个基于存储区网络(SAN)的光纤通道,如同基于通信网络的以太网。
可以理解上述的装置仅仅是根据本发明原理的应用实例,并且其他装置可能由某些熟练的技术人员按照本发明的精神和范围设计,而不脱离本发明的精神和范围。

Claims (17)

1.一种把一个模块热插到一个服务器的机架中的方法,其中包括如下操作:
(a)当热插模块时,确定已在机架中的模块的结构类型;
(b)确定该热插的模块的结构类型;以及
(c)使(a)和(b)中的结构类型互相关联以确定哪种电源状态将应用于该热插的模块。
2.根据权利要求1的方法,其中如果该热插的模块与已安装的模块的结构类型相同,则该热插的模块允许启动。
3.根据权利要求1的方法,其中如果该热插的模块与已安装的模块的结构类型冲突,则不允许启动该热插的模块。
4.根据权利要求3的方法,其中该模块包括插件。
5.根据权利要求3的方法,其中该模块包括互联装置。
6.根据权利要求5的方法,其中该互联装置包括交换机。
7.根据权利要求3的方法,其中该结构类型包括以太网。
8.根据权利要求3的方法,其中该结构类型包括光纤。
9.一种服务器包括:
一个具有完全通电的至少一个插件和至少一个互联装置的机架;
热插入所述机架的至少一个模块;
一个控制器,其确定该插件、该模块以及该互联装置的结构类型;以及
如果所有的结构类型兼容,所述控制器允许在所述至少一个模块上施加电源;如果该结构类型不兼容,所述控制器不允许给所述至少一个模块通电。
10.一种对服务器中的模块供电的方法,其中包括如下操作:、
(a)在通电之前使用第一例程以对已插入所述服务器的模块完全供电;
(b)热插一个模块进入所述服务器的一条插槽,随后对其供电;
(c)确定在操作(a)中的模块的结构类型;
(d)确定操作(b)中的热插模块的结构类型;
(e)把在操作(a)和(b)中确定的结构类型相关联;以及
(f)依照在操作(e)中关联的结果确定所述热插模块的电源状况。
11.根据权利要求10的方法,其中该模块包括一个插件。
12.根据权利要求10的方法,其中该模块包括一个连接器。
13.根据权利要求12的方法,其中该连接器包括交换机。
14.根据权利要求13的方法,其中该交换机包括以太网。
15.根据权利要求10的方法,其中如果该热插模块的结构类型与已插入服务器并在先前启动的模块的结构类型兼容,则允许对所述热插模块完全供电。
16.根据权利要求10的方法,其中如果该热插模块的结构类型与已插入服务器并在先前启动的模块的结构类型不兼容,则不允许对所述热插模块完全供电。
17.一种包括记录了计算机可读程序的媒体的程序产品,所述程序包括:
(a)确定第一组模块的结构类型的指令;
(b)确定其他模块的结构类型的指令;
(c)把在(a)和(b)中结构类型相关联以确定应用于其他模块的电源状态的指令。
CNB2003101183213A 2002-11-27 2003-11-21 对插入带电机架的模块分配电源的设备和方法 Expired - Lifetime CN100378616C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/306,305 2002-11-27
US10/306,305 US6976112B2 (en) 2002-11-27 2002-11-27 Apparatus, method and program product for automatically distributing power to modules inserted in live chassis

Publications (2)

Publication Number Publication Date
CN1503100A true CN1503100A (zh) 2004-06-09
CN100378616C CN100378616C (zh) 2008-04-02

Family

ID=32505808

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2003101183213A Expired - Lifetime CN100378616C (zh) 2002-11-27 2003-11-21 对插入带电机架的模块分配电源的设备和方法

Country Status (5)

Country Link
US (1) US6976112B2 (zh)
JP (1) JP3831723B2 (zh)
KR (1) KR100570129B1 (zh)
CN (1) CN100378616C (zh)
TW (1) TWI240175B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101071327B (zh) * 2006-03-17 2011-05-11 伊顿动力品质公司 使用灵活性配电单元接口的模块化电子系统和方法
CN109587995A (zh) * 2017-09-28 2019-04-05 慧与发展有限责任合伙企业 互相连接的模块化服务器

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7359371B2 (en) * 2001-01-17 2008-04-15 Uniden America Corporation System and method for modular premises communication and networking
US20040076204A1 (en) * 2002-10-16 2004-04-22 Kruschwitz Brian E. External cavity organic laser
US7849332B1 (en) 2002-11-14 2010-12-07 Nvidia Corporation Processor voltage adjustment system and method
US7886164B1 (en) 2002-11-14 2011-02-08 Nvidia Corporation Processor temperature adjustment system and method
US7882369B1 (en) 2002-11-14 2011-02-01 Nvidia Corporation Processor performance adjustment system and method
US7174413B2 (en) * 2003-01-21 2007-02-06 Nextio Inc. Switching apparatus and method for providing shared I/O within a load-store fabric
US7698483B2 (en) * 2003-01-21 2010-04-13 Nextio, Inc. Switching apparatus and method for link initialization in a shared I/O environment
US7953074B2 (en) * 2003-01-21 2011-05-31 Emulex Design And Manufacturing Corporation Apparatus and method for port polarity initialization in a shared I/O device
US7664909B2 (en) 2003-04-18 2010-02-16 Nextio, Inc. Method and apparatus for a shared I/O serial ATA controller
US8032659B2 (en) 2003-01-21 2011-10-04 Nextio Inc. Method and apparatus for a shared I/O network interface controller
US7103064B2 (en) * 2003-01-21 2006-09-05 Nextio Inc. Method and apparatus for shared I/O in a load/store fabric
US8102843B2 (en) * 2003-01-21 2012-01-24 Emulex Design And Manufacturing Corporation Switching apparatus and method for providing shared I/O within a load-store fabric
US7219183B2 (en) 2003-01-21 2007-05-15 Nextio, Inc. Switching apparatus and method for providing shared I/O within a load-store fabric
US7617333B2 (en) * 2003-01-21 2009-11-10 Nextio Inc. Fibre channel controller shareable by a plurality of operating system domains within a load-store architecture
US7502370B2 (en) * 2003-01-21 2009-03-10 Nextio Inc. Network controller for obtaining a plurality of network port identifiers in response to load-store transactions from a corresponding plurality of operating system domains within a load-store architecture
US7917658B2 (en) * 2003-01-21 2011-03-29 Emulex Design And Manufacturing Corporation Switching apparatus and method for link initialization in a shared I/O environment
US7493416B2 (en) * 2003-01-21 2009-02-17 Nextio Inc. Fibre channel controller shareable by a plurality of operating system domains within a load-store architecture
US7046668B2 (en) * 2003-01-21 2006-05-16 Pettey Christopher J Method and apparatus for shared I/O in a load/store fabric
US7836211B2 (en) 2003-01-21 2010-11-16 Emulex Design And Manufacturing Corporation Shared input/output load-store architecture
US7457906B2 (en) 2003-01-21 2008-11-25 Nextio, Inc. Method and apparatus for shared I/O in a load/store fabric
US8346884B2 (en) 2003-01-21 2013-01-01 Nextio Inc. Method and apparatus for a shared I/O network interface controller
US7512717B2 (en) * 2003-01-21 2009-03-31 Nextio Inc. Fibre channel controller shareable by a plurality of operating system domains within a load-store architecture
US7188209B2 (en) 2003-04-18 2007-03-06 Nextio, Inc. Apparatus and method for sharing I/O endpoints within a load store fabric by encapsulation of domain information in transaction layer packets
US20040207440A1 (en) * 2003-04-17 2004-10-21 Naysen Robertson Electrical circuit for controling another circuit or system
US8843604B2 (en) * 2003-06-19 2014-09-23 International Business Machines Corporation Method for interlocking a server to a server system and a computer system utilizing the same
US7213163B2 (en) * 2003-06-25 2007-05-01 International Business Machines Corporation Restoring power in a hot swappable multi-server data processing environment
US8639866B2 (en) * 2003-08-06 2014-01-28 Hewlett-Packard Development Company, L.P. Systems and methods for dividing a communications channel
US20050071689A1 (en) * 2003-09-26 2005-03-31 Continuous Computing Corporation Independently powered slots architecture and method
US7363516B2 (en) * 2003-10-03 2008-04-22 Hewlett-Packard Development Company, L.P. Rack equipment management system and method
US20050138440A1 (en) * 2003-12-18 2005-06-23 Barr Andrew H. Equipment rack load modulation system and method
US7383461B2 (en) * 2004-02-12 2008-06-03 International Business Machines Corporation Method and system to recover a failed flash of a blade service processor in a server chassis
US7398401B2 (en) * 2004-03-25 2008-07-08 Intel Corporation Method and apparatus for communicating information from an operating system based environment of a server blade to the chassis management module
TWI249682B (en) * 2004-05-19 2006-02-21 Quanta Comp Inc Blade server system
US7325149B2 (en) * 2004-12-16 2008-01-29 Dell Products L.P. Power-on management for remote power-on signals to high density server module
US7979862B2 (en) * 2004-12-21 2011-07-12 Hewlett-Packard Development Company, L.P. System and method for replacing an inoperable master workload management process
US20060156041A1 (en) * 2005-01-07 2006-07-13 Lee Zaretsky System and method for power management of plural information handling systems
JP4591185B2 (ja) * 2005-04-28 2010-12-01 株式会社日立製作所 サーバ装置
US7307837B2 (en) * 2005-08-23 2007-12-11 International Business Machines Corporation Method and apparatus for enforcing of power control in a blade center chassis
US7350090B2 (en) * 2005-10-11 2008-03-25 Dell Products L.P. Ensuring power availability to a blade server when blade management controller is corrupted
US7599397B2 (en) * 2005-12-27 2009-10-06 International Business Machines Corporation Obtaining multiple port addresses by a fibre channel switch from a network fabric
US8151011B2 (en) * 2006-04-10 2012-04-03 Dell Products L.P. Input-output fabric conflict detection and resolution in a blade compute module system
JP4653697B2 (ja) 2006-05-29 2011-03-16 株式会社日立製作所 電力管理方法
US8948166B2 (en) * 2006-06-14 2015-02-03 Hewlett-Packard Development Company, Lp. System of implementing switch devices in a server system
US7890677B2 (en) * 2006-09-13 2011-02-15 Dell Products L.P. Chassis management access console via a local KVM display
US7788717B2 (en) * 2006-11-02 2010-08-31 International Business Machines Corporation Apparatus, system, and method for selectively enabling a power-on password
US9134782B2 (en) 2007-05-07 2015-09-15 Nvidia Corporation Maintaining optimum voltage supply to match performance of an integrated circuit
US20080313492A1 (en) * 2007-06-12 2008-12-18 Hansen Peter A Adjusting a Cooling Device and a Server in Response to a Thermal Event
US8065537B2 (en) * 2007-06-12 2011-11-22 Hewlett-Packard Development Company, L.P. Adjusting cap settings of electronic devices according to measured workloads
US8370663B2 (en) 2008-02-11 2013-02-05 Nvidia Corporation Power management with dynamic frequency adjustments
US8306652B2 (en) * 2008-03-14 2012-11-06 International Business Machines Corporation Dual-band communication of management traffic in a blade server system
US8839339B2 (en) * 2008-04-15 2014-09-16 International Business Machines Corporation Blade center KVM distribution
US8244918B2 (en) 2008-06-11 2012-08-14 International Business Machines Corporation Resource sharing expansion card
EP2304582A4 (en) * 2008-06-19 2013-02-13 Hewlett Packard Development Co MORE BLADE CONNECTOR
CN102067101B (zh) * 2008-06-20 2013-07-24 惠普开发有限公司 低层级初始化器
US20100042852A1 (en) * 2008-08-18 2010-02-18 Huawei Technologies Co., Ltd. Power-on protection method, module and system
CN201348781Y (zh) * 2008-12-26 2009-11-18 鸿富锦精密工业(深圳)有限公司 电路板
US8819218B2 (en) * 2009-09-24 2014-08-26 International Business Machines Corporation Apparatus, system, and method for device level enablement of a communications protocol
US8266356B2 (en) * 2009-12-10 2012-09-11 Hewlett-Packard Development Company, L.P. Interconnecting computing modules to form an integrated system
US9256265B2 (en) 2009-12-30 2016-02-09 Nvidia Corporation Method and system for artificially and dynamically limiting the framerate of a graphics processing unit
US9830889B2 (en) 2009-12-31 2017-11-28 Nvidia Corporation Methods and system for artifically and dynamically limiting the display resolution of an application
US8627118B2 (en) 2010-05-24 2014-01-07 International Business Machines Corporation Chassis power allocation using expedited power permissions
TW201142612A (en) * 2010-05-26 2011-12-01 Hon Hai Prec Ind Co Ltd System and method for allocating different I2C addresses for blade type systems
US8839006B2 (en) 2010-05-28 2014-09-16 Nvidia Corporation Power consumption reduction systems and methods
US8880937B2 (en) * 2011-07-07 2014-11-04 International Business Machines Corporation Reducing impact of a repair action in a switch fabric
US8745437B2 (en) 2011-07-07 2014-06-03 International Business Machines Corporation Reducing impact of repair actions following a switch failure in a switch fabric
US8547825B2 (en) 2011-07-07 2013-10-01 International Business Machines Corporation Switch fabric management
US9021076B2 (en) 2011-07-07 2015-04-28 International Business Machines Corporation Managing inventory data for components of a server system
US8874955B2 (en) 2011-07-07 2014-10-28 International Business Machines Corporation Reducing impact of a switch failure in a switch fabric via switch cards
DE102012200042A1 (de) 2012-01-03 2013-07-04 Airbus Operations Gmbh Serversystem, luft- oder raumfahrzeug und verfahren
BE1021333B1 (fr) * 2014-06-30 2015-10-30 eWON SA Dispositif modulaire de communication m2m
CN109844726B (zh) * 2016-08-02 2020-09-29 维谛信息技术系统有限公司 用于分布式控制台服务器架构的系统和方法
US10888013B2 (en) 2017-10-04 2021-01-05 Google Llc Managing a data center

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5416834A (en) * 1991-12-30 1995-05-16 At&T Corp. Redirection of calls by a communication terminal
FR2738008B1 (fr) * 1995-08-25 1997-11-07 Total Raffinage Distribution Utilisation d'un liant bitumineux tres dur dans la preparation d'un enrobe bitumineux, destine notamment aux assises de chaussees
US5784576A (en) * 1996-10-31 1998-07-21 International Business Machines Corp. Method and apparatus for adding and removing components of a data processing system without powering down
US5930496A (en) * 1997-09-26 1999-07-27 Compaq Computer Corporation Computer expansion slot and associated logic for automatically detecting compatibility with an expansion card
US5943232A (en) * 1997-10-29 1999-08-24 Lucent Technologies Inc. Autonomous overload control for distributed real time systems
US6295566B1 (en) * 1998-10-31 2001-09-25 Campaq Computer Corporation PCI add-in-card capability using PCI-to-PCI bridge power management
US6473827B2 (en) * 1998-12-22 2002-10-29 Ncr Corporation Distributed multi-fabric interconnect
US6535944B1 (en) * 1999-03-30 2003-03-18 International Business Machines Corporation Hot plug control of MP based computer system
CN2439119Y (zh) * 1999-07-09 2001-07-11 深圳市华为电气股份有限公司 用于热插拔电子设备的缓冲装置
US6687837B1 (en) * 2000-06-15 2004-02-03 Cisco Technology, Inc. Method and system for controlling the supply of power to a circuit card in a card shelf through an activation signal

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101071327B (zh) * 2006-03-17 2011-05-11 伊顿动力品质公司 使用灵活性配电单元接口的模块化电子系统和方法
CN109587995A (zh) * 2017-09-28 2019-04-05 慧与发展有限责任合伙企业 互相连接的模块化服务器
CN109587995B (zh) * 2017-09-28 2021-06-01 慧与发展有限责任合伙企业 模块化计算系统、框架拖动部和框架

Also Published As

Publication number Publication date
KR100570129B1 (ko) 2006-04-12
KR20040047578A (ko) 2004-06-05
JP2004178598A (ja) 2004-06-24
US20040117536A1 (en) 2004-06-17
JP3831723B2 (ja) 2006-10-11
TW200422854A (en) 2004-11-01
US6976112B2 (en) 2005-12-13
CN100378616C (zh) 2008-04-02
TWI240175B (en) 2005-09-21

Similar Documents

Publication Publication Date Title
CN100378616C (zh) 对插入带电机架的模块分配电源的设备和方法
US9606588B2 (en) Closed-loop cooling system for high-density clustered computer system
JP4015990B2 (ja) 電力供給装置、非中断電力供給方法、およびシステム
US6661671B1 (en) Apparatus, method and article of manufacture for determining power permission for a blade spanning power back planes
TW591413B (en) A common boot environment for a modular server system
US7549018B2 (en) Configurable blade enclosure
US20080259555A1 (en) Modular blade server
US7194655B2 (en) Method and system for autonomously rebuilding a failed server and a computer system utilizing the same
US20080270633A1 (en) Shared simultaneously-connected drives
US20090187694A1 (en) Computer system and management method thereof
TW200537846A (en) Automatic configuration of the network devices via connection to specific switch ports
CN102478006A (zh) 风扇控速系统及其风扇转速读取方法
US7480720B2 (en) Method and system for load balancing switch modules in a server system and a computer system utilizing the same
US7137014B2 (en) Apparatus, method and program product for automatically distributing power to modules within a server
CN115708040A (zh) 一种主板及计算设备
US20170091133A1 (en) Universal sleds server architecture
Cisco Product Overview
Cisco Troubleshooting the Installation
CN1896958A (zh) 应用于刀锋伺服系统的错误检测方法与装置
Cisco Product Overview
Cisco Product Overview

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20080402

CX01 Expiry of patent term