CN101406004A - 在包括绑定适配器的通信网络中检测故障的方法和装置 - Google Patents

在包括绑定适配器的通信网络中检测故障的方法和装置 Download PDF

Info

Publication number
CN101406004A
CN101406004A CNA2007800099119A CN200780009911A CN101406004A CN 101406004 A CN101406004 A CN 101406004A CN A2007800099119 A CNA2007800099119 A CN A2007800099119A CN 200780009911 A CN200780009911 A CN 200780009911A CN 101406004 A CN101406004 A CN 101406004A
Authority
CN
China
Prior art keywords
activity
adapter
communications component
data
route
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800099119A
Other languages
English (en)
Inventor
B·华
S·科杜库拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101406004A publication Critical patent/CN101406004A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/24Multipath
    • H04L45/245Link aggregation, e.g. trunking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Abstract

提供了用于监控诸如网络适配器这样的通信组件的活动以及标识具有低于正常活动级别的组件的方法和装置。所标识的通信组件可以成为可疑组件和候选者用于进一步的测试,包括不同形式的询问。询问候选者的过程可以包括生成并向所述候选者发送具有所述候选者的媒体访问控制(MAC)地址的测试分组,并且如果在所述询问后没有检测到活动,则可以将所述候选者标记为出故障的组件。相应地,可以解除激活所述组件并将其从服务中移除。在进一步的实施例中,备用组件可以被激活并承担先前由所述出故障的组件所承担的角色。

Description

在包括绑定适配器的通信网络中检测故障的方法和装置
技术领域
本公开一般涉及通信网络。更特别地,本公开涉及在诸如绑定适配器(bundled adapter)的通信组件绑定组中检测各个组件的故障的方法和装置。
背景技术
在诸如服务器、路由器、交换机和计算机这样的通信设备之间的通信中,对速度和可靠性的需求持续增加。需要相当多网络资源的应用或其它程序(例如流式在线媒体)不断地增加普及度。进一步地,用户的数量持续增加,并且随着带宽增加,用户对改进的带宽设想出新的用途。因而,在已经接近容量进行操作的网络中,对带宽的需求看来似乎不断地增加。
基于以太网的通信网络已经在市场上获得普及,并且以太网技术的变化持续提供改进的带宽。更具体而言,以太网家族已经被扩展为包括快速以太网系统和吉比特以太网系统。这两种系统在现有的以太网配置之上提供了显著的带宽改进。然而,即使这些以太网系统也不能充分满足增长的需求。
针对该缺点,很多当前的通信网络具有可扩缩特征,当对带宽的需求增加时,其允许增加额外的通信路径。在基于以太网的系统中,增加诸如网络接口卡(NIC)的网络适配器促进了这些新的通信路径。网络适配器通常包括适配卡和网络驱动器,其是促进了适配卡的操作的代码,例如通过计算机操作系统。
通常,多个适配卡可以被“绑定”,例如,被插入到通信设备中并被配置为并行地传送和接收数据。在以太网网络中,以太通道(Etherchannel)驱动器通常对绑定适配器实现负载分担的安排。已经针对用于一群通信设备的绑定适配器开发了诸如IEEE 802.3a&d的很多标准。绑定适配器不被分派给特定的通信设备,但是可以基于一个适配器相对于绑定适配器中的其它适配器的工作负载,向绑定适配器中的该适配器分派来自群集通信设备的传输。从软件应用的角度来看,绑定适配器的并行操作有效地创建了单个更高带宽的通信通道。例如,具有八个网络适配器的绑定组可以将数据传输速度增加到单个适配器的速度的八倍。
此外,取决于绑定适配器所支持的群集通信设备的数目,绑定适配器可以被配置以便处理对于单个网际协议(IP)地址或多个IP地址的数据传输。因而,诸如交换机、路由器和服务器的通信设备可以被群集,并且被配置为共享绑定适配器,或者可以利用由绑定适配器组成的专用高带宽通道。
支持群集通信设备的绑定适配器可以被用于创建高可用性群集多处理(HACMP)环境。HACMP环境确保通信路径可用并且通信设备几乎在所有时间是可达的,从而使得停机时间很少发生。HACMP系统中的通信设备还可以合并故障检测方案来检测发生故障的通信通道。
在历史上,用于通信网络的故障检测方案已经利用了“心跳(heartbeat)”机制。通过检测通信通道的操作状态,即数据是否可以成功经过通道传输,心跳机制被用于在诸如HACMP这样的软件应用层检测网络适配器的操作状态。
这样的故障检测方案识别出不能够经过通道传输数据,并且在单个网络适配器处理对于经过通道的通信的传送和接收时,可以将该故障与网络适配器关联。当前的故障检测方案的问题在于它们不允许在适配器绑定组中检测网络适配器的子集。对于绑定适配器,软件应用感知通道的操作而不是各个适配器的操作。特别地,如果绑定组中的一个网络适配器出故障,则以太通道驱动器将重传被分派至出故障的适配器的数据分组,直到经由绑定组中的其它适配器的成功传输出现。因此,经过通道的数据通信会恶化但不一定出故障。重传直到获得成功通信的过程极大地降低了通信系统的效率。
发明内容
通过文中所提供的用于在具有诸如网络适配器这样的绑定组件及其子组件的通信网络接口中检测故障的方法和装置,上述问题的很大部分得以解决。一个实施例包括一种用于检测组件绑定组中的通信组件的故障的方法。所述方法可以涉及:将数据路由至与所述绑定组中的其它通信组件共享至少一个网际协议地址的通信组件,其中路由所述数据应当激活所述通信组件的至少一部分;以及监控所述通信组件的所述至少一部分,以便确定所监控的响应于通信的活动级别。所述方法进一步涉及:将所监控的活动级别与预定的活动级别进行比较,以及如果所监控的活动级别小于预定的活动级别,则将所述通信组件标记为出故障的组件。
另一实施例包括一种被配置以便检测故障的装置。所述装置可以包括通信业务生成器,其适于生成至少一个分组以便启动经由组件的绑定组中的通信组件而被路由的数据传输,其中,所述组件的绑定组被配置以便分担与至少一个网络地址相关的数据传输活动。所述装置可以进一步包括活动监控器和活动比较器,所述活动监控器检测所述通信组件响应于所述至少一个分组而被监控的活动级别,所述活动比较器将所监控的活动级别与预定的活动级别进行比较,以便确定是否将所述通信组件标识为出故障的组件。
进一步的实施例包括一种用于检测绑定适配器的网络适配器的故障的装置。所述装置可以包括定时器、活动监控器和活动比较器,所述定时器限定时间间隔,所述活动监控器确定网络适配器在所述时间间隔期间的活动级别并且监控所述网络适配器响应于至少一个测试分组的活动,所述活动比较器将所确定的活动级别与预定的活动级别进行比较,以便如果所确定的活动级别小于所述预定的活动级别,则将所述网络适配器标识为可疑适配器。所述装置可以进一步包括:通信业务生成器,其向所述可疑适配器传输至少一个测试分组;以及标记器,以便如果所监控的活动小于与所述至少一个测试分组关联的所预计的活动,则所述标记器将所述可疑适配器标记为出故障的适配器。
另一实施例包括一种系统。所述系统可以包括:绑定适配器,其分担数据传输负载;以及故障检测逻辑,其耦合于所述绑定适配器,以便检索指示数据传输活动的第一值并且基于所述值来标识可疑适配器。所述故障检测逻辑还可以经由所述可疑适配器来传输测试分组,检索指示经由所述可疑适配器的数据传输活动的第二值,以及基于所述第二值来确定是否将所述可疑适配器标记为出故障的适配器。
而另一实施例包括一种计算机程序产品,其包括具有计算机可读程序的计算机可用介质。当在计算机上执行时,所述计算机可读程序使得所述计算机:将数据路由至与绑定组中的其它通信组件共享至少一个网际协议地址的通信组件,其中路由所述数据应当激活所述通信组件的至少一部分;以及监控所述通信组件的所述至少一部分,以便确定所监控的响应于通信的活动级别。当在计算机上执行时,所述计算机可读程序进一步使得所述计算机:将所监控的活动级别与预定的活动级别进行比较,以及如果所监控的活动级别小于预定的活动级别,则将所述通信组件标识为出故障的组件。
附图说明
现在将参照附图,仅通过示例的方式描述本发明,在附图中:
图1描绘了两个通信设备,其经由绑定适配器互连以便在数据储存库和数据接口之间传送大量数据;
图2说明了具有绑定的以太网适配器和故障检测逻辑的通信设备的一部分的框图;
图3描绘了用于绑定组件的故障检测逻辑的框图;
图4说明了在绑定配置中检测组件的故障的方法;
图5描绘了在适配器绑定组中检测发生故障的适配器的方法;以及
图6说明了具有可被用于实现文中所描述的方法的绑定适配器的计算机系统。
具体实施方式
以下是对附图中所描绘的新颖性实施例的详细描述。如此详细的实施例是为了清楚地表达主题。然而,所提供的细节量并不旨在限制所描述的实施例的可预期的变化;相反,权利要求和详细描述将覆盖落入由所附权利要求所限定的本教导的精神和范围内的所有修改、等同物和替代物。以下的详细描述被设计成使得这样的实施例对本领域的普通技术人员来说是可理解的。
一般而言,文中提供了在具有绑定组件的通信网络中检测故障的方法和装置。虽然下面将参照适配器、组件、电路或逻辑配置来描述特定实施例,但是本领域的技术人员将意识到可以有利地以其它组件和配置来实现本公开的实施例。很多实施例可以有效地检测已被绑定在通信网络中的任何组件或组件子集的故障。
此后描述的实施例检测诸如绑定适配器这样的组件绑定组中的各个组件的故障。组件经常被绑定,例如被配置为一起工作并分担工作负载,以便众多组件可以为单个计算机、交换机、路由器、集线器等或其组群传送和接收数据。通常,通信设备可以经由绑定适配器连接通信网络。一个实施例可以通过并入适配器的媒体访问控制(MAC)地址向绑定组的适配器发送测试分组。该实施例然后可以监控该适配器以便确定传输是否在该适配器内创建活动。如果没有检测到活动,则该适配器可以被标记为出故障的适配器。
进一步的实施例可以针对成功发送和/或接收数据来监控适配器绑定中的适配器。在这样的实施例中,如果适配器的活动不满足或超过预定的活动级别,则一个或多个测试分组可能被寻址以便向该适配器传送和/或从该适配器传送。
可以经由一个或多个机制来实现对适配器绑定组中的适配器的活动监控。例如,在绑定组的每个适配器中的寄存器可以维护从对应的适配器传输的分组的计数或其它指示和/或向对应的适配器传输的分组的计数或其它指示。在某些实施例中,该指示可以包括指示成功传送和/或接收数据的计数或其它值。在其它实施例中,电路可以监控由适配器应用于通信介质的信号来确定传输活动。在进一步的实施例中,适配器可以监控与适配器关联的输入或输出队列的内容来确定活动级别。此外,仍在进一步的实施例中,可以启动每个适配器内的自测机制来确定活动。还可以设想其它的监控实现。
一旦适配器未通过测试,该适配器便可以被标记为出故障的适配器和/或备用适配器可以激活以便替换出故障的适配器。出故障的适配器还可以被解除激活。
现在转至图1,其示出了适于在数据接口110与数据储存库150之间传输大量数据的通信网络100或其至少一部分。例如,数据储存库150可以维护经由储存库接口152可访问的大量数据154,并且数据接口110可以促进经由储存库接口112对数据114的访问和经由储存库接口152对数据154的访问。通信设备120和160可以在数据接口110与数据储存库150之间提供高速数据传输,以便减少在数据114与数据154之间访问的延时差。
通信网络100包括耦合于通信设备120的数据接口110和耦合于通信设备160的数据储存库150。此外,通信设备120经由通信介质140在通信上耦合于通信设备160。通信设备120和140可以包括服务器、交换机、路由器、桥接器,或者可以经由通信介质140进行通信的任何其它设备。尽管通信介质140被示为有线连接,然而通信介质140还可以经由无线收发器、光纤丝和/或其它通信介质来实现。在某些实施例中,通信设备120和140还可以分别包括诸如以太通道驱动器、以太网驱动器和故障检测逻辑130和170这样的组件。
在本实施例中,通信介质140包括具有连接器的线缆,其中连接器插入由绑定适配器124和164所提供的端口中。每个端口可以在通信介质140的线缆与绑定适配器124或164中的单个适配器之间提供物理连接。绑定适配器124可以包括两个或更多的被绑定的适配卡,以便分担通信设备120和160之间的数据传输责任。绑定适配器124和164可以是插入到通信设备120和164中的卡槽内的电路卡,并且可以包括一个或多个备用卡以防绑定适配器之一出故障或者对于经通信介质140的数据传输来说的其它不可靠情况。此外,绑定适配器124和164可以在通信过程中实现(开放系统互连“OSI”层模式的)数据链路和物理层操作,以便在通信设备120与通信设备160之间传送数据。
故障检测逻辑130可以是这样的硬件、代码或其某种组合,即其适于检测绑定适配器124的在故障中或出故障的适配卡并且在某些实施例中激活备用适配卡来替换出故障的或在故障中的适配卡。故障检测逻辑130包括定时模块132、活动监控器/比较器134和通信业务生成器136。定时模块132可以包括时钟或接收时钟信号以便确定与绑定适配器124的一个或多个适配卡的数据传输活动相关的时间周期的截止时间。
活动监控器/比较器134可以在该时间周期期间监控与适配卡相关的数据传输活动,并且将活动级别与预定的活动级别进行比较。如果适配卡的活动级别小于对该适配卡所预期的活动级别或通常对绑定适配器124的适配卡所预期的活动级别,则活动监控器/比较器134可以指示该活动级别是可疑的。在某些实施例中,该指示可以与特定的适配卡相关。
在其它实施例中,活动监控器/比较器134可以监控和比较通过适配卡的数据传输的其它方面,例如重传请求数、不成功的数据传输比上成功的数据传输的分数,等等。在这样的实施例中,活动监控器/比较器134可以将活动与预定值进行比较或者可以将活动与绑定适配器124中的其它适配卡的活动进行比较。在进一步的实施例中,相对于与经过通信介质140的通信业务有关的试探数据(heuristic data)和/或为绑定适配器124所实现的负载平衡方案,可以为每个适配卡加权活动比较。
响应于来自活动监控器/比较器134的可疑活动级别的指示,通信业务生成器136可以经由绑定适配器124中的一个或多个适配器传输测试分组。在几个实施例中,通信业务生成器136可以包括绑定适配器124的一个或多个单独的适配卡的源和/或目的MAC地址122以确保正被测试的特定适配卡被分派任务来传送和/或接收测试分组。例如,如果活动监控器/比较器134指示特定适配卡的活动是可疑的,则通信业务生成器136可以传送具有该可疑适配卡的源和/或目的地址的分组。在其它实施例中,故障检测逻辑130可以通过这样的方式来传输多个分组,即在该方式下,确保每个适配卡可以至少一次传送和/或接收该分组。
在通信业务生成器136经由绑定适配器124的适配卡传送一个或多个测试分组之后,活动监控器/比较器134针对传送和/或接收活动而监控对应的适配卡。如果一个或多个适配卡未能指示与测试分组相关的传送和/或接收活动,则故障检测逻辑130可以通过在寄存器中存储一个或多个比特来将一个或多个适配卡标记为出故障的。
故障检测逻辑170通过类似于故障检测逻辑130与绑定适配器124交互的方式来与绑定适配器164进行交互。然而,故障检测逻辑170包括存储MAC地址178的存储器,而故障检测逻辑130访问经由通信设备120可获得的MAC地址。在很多实施例中,故障检测逻辑130可以与故障检测逻辑170进行通信,以便标识绑定适配器124和164中出故障的或在故障中的适配器。例如,当绑定适配器124中的适配器未能接收分组时,问题可能出现在该适配器或适配器绑定164中的传输适配器。因而,故障检测逻辑130可以与故障检测逻辑170进行通信以便确定故障检测逻辑170的活动监控器是否指示对分组的成功传输。如果绑定适配器164成功传输了分组而绑定适配器124在多次重传后未能接收该分组,则出故障的适配器可能是绑定适配器124的一部分。另一方面,如果绑定适配器164中的适配器在多次重试之后仍未成功传输分组,则出故障的适配器可能是绑定适配器164的一部分。
参照图2,其示出了与用于以太网接口的绑定适配器240关联的开放系统互连(OSI)层示图200。该实施例提供了对于很多可行协议中的一个协议的例子。进一步的实施例实现其它协议。通常,应用202表示诸如操作系统这样的指令集、支持操作系统的代码、在操作系统所创建的环境内执行的代码和/或其它代码。应用202可以确定经以太网来传输信息,并且可以产生代表与经由套接字204所定义的协议相兼容的信息的可传输数据。
传输控制协议/网际协议(TCP/IP)206包括两层协议以便使信息适合经过像以太网这样的TCP/IP网络进行传输。以太通道驱动器220包括利用以太网驱动器250-290和以太网适配器254-294作为绑定适配器240的代码。特别地,以太通道驱动器220在绑定适配器240的适配器254-294之间划分数据传输责任,而诸如以太网驱动器270这样的以太网驱动器协调通过诸如以太网适配器274这样的单个适配器而经由通信介质的传输。在本实施例中,以太通道驱动器220维护以太网驱动器250和以太网适配器254作为备用设备256并且可以利用备用设备256来替换绑定适配器240的处于故障中的适配器和驱动器对。
以太通道驱动器220包括路由器222、媒体访问控制(MAC)地址表224和故障检测逻辑230。路由器222确定经由TCP/IP 206所接收的数据的路由。路由器222可以将输出数据置于输出队列中。在某些实施例中,输出队列可以与以太网驱动器250-290中的特定以太网驱动器相关联。在进一步的实施例中,路由器222可以将数据的分组与来自MAC地址表224的MAC地址相关联,以便向数据的分组分派以太网驱动器250-290中的特定以太网驱动器。而在其它实施例中,基于以太网适配器254-294传输分组的可用性、与分组关联的优先级和/或其它因素,以太网驱动器250-290可以收集来自与绑定适配器240关联的输出队列的分组。
故障检测逻辑230可以测试和监控以太网驱动器250-290和以太网适配器254-294的操作以便检测发生故障的适配器。故障检测逻辑230可以是以太通道驱动器220的代码并且可以包括通信业务生成器232、活动比较器234和活动监控器236。在某些实施例中,通信业务生成器232可以生成分组,并且通过将分组与用于以太网驱动器280的一个或多个MAC地址进行关联来向以太网适配器284分派对分组的传送和/或接收。在传送和/或接收分组时,以太网驱动器280可以在寄存器中增加一个或多个值,即TX计数/RX计数282。活动监控器235可以检测TX计数/RX计数282,并且活动比较器234可以将所检测到的活动与所预计的活动进行比较来确定以太网驱动器280和以太网适配器284是否操作正确。如果以太网驱动器280和以太网适配器284操作不正确,则故障检测逻辑230可以将以太网驱动器280和以太网适配器284标记为出故障的适配器,并且在本实施例中,利用备用设备256。在进一步的实施例中,故障检测逻辑230可以经由硬件、应用202和/或其它通知设备来传输对出故障的适配器的通知。
在其它实施例中,故障检测逻辑230可以具有内部定时器,并且命令以太网驱动器250-290在预定的时间间隔期间在寄存器中存储传送活动和接收活动数据,即TX计数/RX计数252-292。在时间间隔期满之后,活动监控器236可以从TX计数/RX计数252-292检索活动级别数据。活动比较器234可以将所检索的活动数据与活动的门限级别进行比较,以便标识出看来似乎呈现异常行为的驱动器和适配器。活动级别可以是对于每分钟通过适配器传送和/或接收多少分组的测量。如果故障检测逻辑230确定诸如驱动器或适配器这样的组件在以可接受的方式操作,则定时器和寄存器可以被重置为零,并且监控可以继续。另一方面,如果故障检测逻辑230确定驱动器和/或适配器具有低活动级别,或者活动级别小于预定级别,则可以将该驱动器和/或适配器标识为可疑驱动器和/或适配器(用于进一步测试的候选者)。
在标识了可疑驱动器和/或适配器时,通信业务生成器232可以生成测试分组并且将该分组寻址于可疑适配器。这样的分组还可以包括echo(回送)命令或ping(查验)命令。在其它实施例中,通信业务生成器232可以请求应用202或其它机制生成分组,并且然后将分组与可疑适配器的MAC地址相关联。
在分组被发送之后,活动监控器236可以再次检索所存储的TX计数/RX计数252-292的活动数据,以便查看分组是否促进了任何传送或接收活动。在一个实施例中,活动监控器236可以监控对分组的特定应答。echo命令还可以请求由可疑驱动器或适配器实现的自测。在进一步的实施例中,可以通过故障检测逻辑230来收集和分析多种类型的反馈,以便确定适配器是否已发生故障。
绑定适配器240可以是分别与以太网适配器254-294成对的多个以太网驱动器250-290,其适于经由代码和/或硬件而起到单个通信通道的作用。可以向每个以太网驱动器和以太网适配器对分派独占的媒体访问控制(MAC)地址。此外,在本实施例中,每个以太网驱动器250-290可以包括分别维护TX计数/RX计数252-292的逻辑,以便促进对每个以太网驱动器和以太网适配器对的数据传输活动的监控。此外,以太网适配器254-294中的每一个均可以包括将绑定适配器240连接到通信介质的端口。以太网适配器254-294可以以电路卡的形式实现,这些电路卡可插入到机架、插件箱、处理设备或通信设备中并且可从中移除。
在本实施例中,以太网驱动器250-290中的每一个均具有传送活动监控器和计数器以及接收活动监控器和计数器来维护TX计数/RX计数252-292。TX计数/RX计数252-292存储的值指示关联的以太网驱动器和以太网适配器这二者过去的活动。例如,TX计数/RX计数252-292可以存储在预定的时间间隔期间传送和接收的分组数。在其它实施例中,活动监控器/计数器甚至可以被体现为单独的电路卡(未示出)。更进一步地,活动监控器/计数器可以适于检测信号线上的信号变换,并且相应地存储这样的数据。在其它实施例中,寄存器、TX计数/RX计数252-292可以处于远程位置。
参照图3,其描绘了通信网络接口300的另一实施例。通信网络接口300包括通信设备310,其具有耦合于绑定组件350和故障检测逻辑320的绑定驱动器312和存储器314。通信设备310经由绑定组件350通信介质354-384发送和接收数据。并且绑定驱动器312在绑定组件350的组件352-382之间分布对于输出数据的数据传输负载。
故障检测逻辑320可以包括具有组件标记器342和活动监控器344的处理器340。故障检测逻辑320还可以包括存储器330、时钟/定时器322、活动比较器324以及通信业务生成器326。处理器340协调测试功能和数据的测试和使用。例如,处理器340可以基于预定的和/或动态的因素(例如时钟周期的经过、先前的活动级别、活动的模式和/或其它因素)来启动测试。
在操作期间,时钟/定时器322可以被配置以便定义特定的时间周期,在此期间可以进行监控过程。这样的定时参数可以被用于激活和解除激活很多组件或过程,并且对这种激活的定时配置可以是用户可选择的。例如,可以在重新出现的预定间隔处监控组件362-382的活动达特定持续时间的时间周期。在本实施例中,用户可以选择或修改这些依赖于时间的特征中每一个的定时。这样的用户选择可以被存储在存储器330的活动时间周期332中。
处理器340可以从响应于时钟/定时器322的活动监控器344请求数据传输活动,并且将该数据传输活动传递至活动比较器324。活动比较器324可以将该活动与存储在用于组件352-382的存储器330中的活动级别334进行比较,当由活动监控器344所确定的活动级别小于活动级别334的预定活动级别时,处理器340可以基于该结果标识可疑组件。处理器340然后可以激活通信业务生成器326来生成并传输具有可疑组件的MAC地址的测试分组。测试分组可以包括从可疑组件请求响应的指令。活动监控器344可以监控系统在发送测试分组之后的任何活动,并且如果活动监控器344没有检测到适当的响应,则组件标记器342可以标记可疑组件。
在某些实施例中,活动级别334可以是预先的测试度量(preliminarytest metrics),基于与绑定组件350内的组件的平均活动级别或特定组件的活动级别相关的试探数据,可以对该预先的测试度量进行更新。在其它实施例中,级别可以包括预期的中值或平均值活动级别、预期的级别范围和/或其它级别指示。
通信业务生成器326可以生成测试分组,其具有ping命令、echo命令、自测命令或指示组件应答特定数据(例如,对存储在特定存储位置的内容的请求)的命令。活动监控器344还可以借助于其它组件或源来获得组件活动的结果。因而,通信业务生成器326可以生成分组并将分组发送给可疑或候选组件,并且如果该组件操作不正确,则通信网络接口300不会接收到适当的应答,并且组件可以被标记为出故障的组件。
当确定组件已发生故障时,通过利用备用组件352的MAC地址来替换出故障的组件的MAC地址,故障检测逻辑320可以激活备用组件352并解除激活出故障的组件。可以调整(即加长或缩短)以上所提及的时间间隔和时间周期来改进故障检测逻辑320的性能。
绑定组件350包括组件362、372和382(362-382)以及备用组件352。绑定组件350可以包括诸如以太网适配卡的设备,并且可以促进远程设备(未示出)与通信设备310之间的网络通信。线路N组件382表示可以与组件362和372进行绑定的任何数目的组件。
参照图4,其公开了流程图400,该图描绘了用于通信网络接口的绑定通信组件的故障检测逻辑的实施例的操作。如块402中所说明的,故障检测逻辑可以被初始化。在初始化期间,故障检测逻辑可以存储获得最小活动门限级别以及通信组件的采样活动级别的时间间隔,并且可以重置活动计数和定时器。另外,对于用户所提供的重新出现的测试间隔,故障检测逻辑可以存储时间间隔或工作循环。所存储的参数可以规定对通信组件的活动进行采样的事务的定时。在一个实施例中,以太网适配器是所关注的通信组件。最小活动级别可以包括成功传输确认与重试请求的比率、被成功传输的分组数、被成功接收的分组数和/或指示通信组件的操作的其它因素。
在块404中,故障检测逻辑可以在采样周期期间监控通信组件的活动,该采样周期在是决402处的初始化期间被设置的。在判决块406处,活动比较器可以将通信组件的活动级别与预定的活动级别进行比较,以便确定通信组件的活动级别是否在预定级别之上。如果通信组件的活动级别在预定级别之上,则故障检测逻辑可以前进到块416以便重置定时器和计数器,并且前进到块404以便继续监控相同的或另一通信组件的活动。
如在块406处确定的,当通信组件的活动级别低于预定级别时,故障检测逻辑可以处理一个或多个测试分组,以便经由通信组件传送和接收这一个或多个测试分组,如块408中所描述的。在判定块410处,故障检测逻辑可以确定通信组件是否显示出响应于这一个或多个测试分组的任何活动。如果检测到多于门限活动,那么故障检测逻辑可以前进到块416,在此重置定时器和计数器,并且监控活动可以继续。当检测到少于门限活动级别时,故障检测逻辑可以在块412处解除激活通信组件和/或从分派可用性表中移除通信组件。分派可用性表可以包括可用于分派输出分组经由通信介质传送的MAC地址和/或可用于经由通信介质接收分组的MAC地址。
在块414处,故障检测逻辑可以激活诸如备用以太网适配器这样的备用组件来替换出故障的通信组件。在一种配置中,故障检测逻辑可以以电子邮件(email)的格式将消息发送给用户或网络的管理员,以便尽力向管理员通知该故障。这样的故障检测系统可以检测与绑定组件关联的硬件和软件故障。
在另一实施例中,可以跳过在块404和406中所说明的步骤,其中,当在块402处初始化之后,该过程可以在预定的时间间隔(可能每十分钟)发送测试通信,并监听应答。如在块410中所说明的,还可以基于检测空闲通信组件来激活测试通信。
参照图5,其描绘了故障检测逻辑检测绑定适配器的各个适配器的故障的流程图500。如块502中所说明的,故障检测逻辑可以设置传送计数器(TX COUNT)和接收计数器(RX COUNT)为预定值或门限值(分别是X和Y),例如零,指示适配器甚至在低活动周期期间都应当具有的最小活动级别。依照块504,故障检测逻辑可以基于定时器来确定将在何时监控适配器的活动以及监控多长时间。
定时器可以具有预定的截止期限值,并且当时间周期截止时创建告警。如块508中所说明的,当时间周期截止时,故障检测逻辑可以检索对适配器所监控的传送计数(X′)和接收计数(Y′)。在判决块510处,故障检测逻辑可以确定所监控的传送和接收计数(X′和Y′)是否小于在块502中设置的预期的传送和接收计数(X和Y)。如块511中所说明的,当门限计数小于或等于所监控的计数时,传送计数器(TX COUNT)可以被设置为所监控的传送计数(X′),并且接收计数器(RX COUNT)可以被设置为所监控的接收计数(Y′)。故障检测逻辑然后可以前进回到块504,在此重启定时器。
当所监控的计数(X′和Y′)小于门限计数(X和Y)时,通信业务生成器可以对适配器生成测试分组,如块512中所说明的。依照块513,故障检测逻辑可以路由测试分组以便经由适配器传送和/或接收该测试分组。在块514处,活动监控器可以收集所监控的传送和接收计数(X′和Y′)。然后,活动比较器可以再次将预期的传送和接收计数(X和Y)与所监控的传送和接收计数(X′和Y′)进行比较,以便确定所监控的计数是否响应于测试分组而改变,如在判决块516处所说明的。当所监控的计数响应于测试分组而改变时,在块512处可以重置门限计数(X=X′,并且Y=Y′)。如果所监控的计数并未改变,则故障检测系统可以标识该适配器为出故障的或坏的适配器,如块518所描述的。故障检测逻辑然后可以返回块504来继续监控绑定适配器的其余部分。
图6以框图格式说明了诸如个人计算机系统600的处理设备。计算机系统600被示为包括可以是常规专有数据处理器的中央处理单元610,包括随机访问存储器(RAM)612、只读存储器(ROM)614以及输入-输出(I/O)适配器622在内的存储器、用户接口适配器620、绑定适配器接口624和多媒体控制器626。
输入输出(I/O)适配器622进一步连接和控制盘驱动647、打印机645、可装卸存储设备646,以及其它标准和专有I/O设备。用户接口适配器620可以被视为专门的I/O适配器。所说明的适配器620连接至鼠标640和键盘641。另外,用户接口适配器620可以连接至能够提供各种类型的用户控制的其它设备,例如触摸屏设备(未示出)。
绑定适配器接口624促进经由绑定适配器650的高带宽数据传输并且还与调制解调器651相耦合。绑定适配器接口624包括故障检测逻辑625,以便监控绑定适配器650的各个适配器的正确操作。例如,故障检测逻辑625可以将所监控的重试比上成功传输的分数与预定分数进行比较。对于特定适配器来说,如果所监控的分数显著大于预定的分数,故障检测逻辑625可以通过生成用于特定适配器传送和接收的测试分组来进一步测试该适配器。如果特定适配器在预定数目的重试内传送和接收了测试分组,则该适配器可以被标记为可疑的并且故障检测逻辑625可以继续监控绑定适配器650。另一方面,如果特定适配器未在预定数目的重试内传送和接收测试分组,则该适配器可以被标记为出故障的并且故障检测逻辑625可以继续监控绑定适配器650的其余部分。
多媒体控制器626通常将包括能够在监控器660上显示图像以及向外部组件(未示出)提供音频的视频图形控制器。另外,诸如系统600的系统可以被用于执行在本公开内所描述的方法。
本发明的另一实施例被实现为用于实现诸如参照图1-6所描述的系统和方法的故障检测逻辑的程序产品。本发明可以采取全硬件实施例、全软件实施例或者既含有硬件又含有软件元素的实施例的形式。在一个实施例中,以软件(其包括但不限于固件、常驻软件、微码等)实现本发明。
此外,本发明可以采取可从计算机可用或计算机可读介质访问的计算机程序产品的形式,该计算机可用或计算机可读介质提供由计算机或任何指令执行系统使用的或者与计算机或任何指令执行系统结合使用的程序代码。对于本说明书来说,计算机可用或计算机可读介质可以是能够容纳、存储、通信、传播或传送由指令执行系统、装置或设备使用的或者与指令执行系统、装置或设备结合使用的程序的任何装置。
介质可以是电子、磁性、光学、电磁、红外或半导体系统(或装置或设备)或者传播介质。计算机可读介质的例子包括半导体或固态存储器、磁带、可装卸计算机磁盘、随机访问存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。光盘的当前的例子包括只读光盘存储器(CD-ROM)、读/写光盘(CD-R/W)和DVD。
适于存储和/或执行程序代码的数据处理系统可以包括通过系统总线直接地或间接地耦合于存储元件的至少一个处理器。存储元件可以包括在程序代码的实际执行期间所采用的局部存储器、大容量存储器,以及为了减少在执行期间必须从大容量存储器检索代码的次数而提供对至少一些程序代码的临时存储的高速缓冲存储器。
输入/输出或I/O设备(包括但不限于键盘、显示器、指点设备等)可以直接地或者通过插入I/O控制器而耦合于系统。网络适配器也可以耦合于系统,从而使得数据处理系统能够适于通过介入专用或公用网络而耦合于其它的数据处理系统或远程打印机或存储设备。调制解调器、电缆调制解调器和以太网适配卡正是几种当前可用类型的网络适配器。
如以上所描述的故障检测逻辑可以是用于集成电路芯片的设计的一部分。以图形化计算机编程语言创建该芯片设计,并且将其存储在计算机存储介质(例如在存储接入网中的诸如磁盘、磁带、物理硬盘驱动或虚拟硬盘驱动)中。如果设计者不制造芯片或不制造用于制造芯片的光刻掩模(photolithographic mask),则设计者通过物理装置(例如,通过提供存储该设计的存储介质的副本)或者电子地(例如,通过因特网)向这样的实体直接或间接地传输所得到的设计。所存储的设计然后被转换成用于制造光刻掩模的适当的格式(例如,GDSII),光刻掩模通常包括所关注的将在晶片上形成的芯片设计的多个副本。光刻掩模被用于限定要蚀刻的或用别的方式来处理的晶片(和/或其上的层)的区域。
制造者可以将所得到的集成电路芯片按照原始晶片的形式(即,作为具有多个未包封的芯片的单个晶片)作为裸芯片来分布或按照包封的形式来分布。在后者的情况下,芯片被安装在单个芯片包封(例如塑料载体,具有附于母板或其它更高级别载体的引线)中或多个包封(例如陶瓷载体,具有表面互连或隐埋互连之一或二者皆有)中。在任何情况下,芯片然后都与其它芯片、分立电子元件和/或其它信号处理设备相集成,作为以下的一部分:(a)诸如母板的中间产品,或者(b)最终产品。最终产品可以是包括集成电路芯片的任何产品,范围从玩具和其它低端应用到具有显示器、键盘或其它输入设备和中央处理器的高级计算机产品。
对于获益于本公开的本领域技术人员显而易见的将是本公开设想了用于检测通信系统中的故障的方法和装置。要理解到,在详细的说明书和附图中所示出和描述的实施例的形式将仅作为例子。旨在广泛解释下面的权利要求以便涵盖所公开的示例性实施例的所有变型。
尽管已对某些实施例详细描述了本公开及其某些优势,然而应当理解到,在不背离如所附权利要求所限定的本公开的精神和范围的情况下,此处可以进行各种改变、替换和变更。尽管本发明的特定实施例可以实现多个目标,然而并不是落入所附权利要求的范围内的每个实施例都将实现每个目标。此外,本申请的范围并不旨在限于在本说明书中所描述的有关过程、机器、制品、事物的组成、装置、方法和步骤的特定实施例。本领域的普通技术人员根据本发明的公开将容易理解到,可以根据本发明来利用当前存在的或稍后将发展的在实质上实现了如文中所描述的对应实施例的相同功能或在实质上获得相同结果的过程、机器、制品、事物的组成、装置、方法或步骤。因此,所附权利要求旨在包括在其范围内的这样的过程、机器、制品、事物的组成、装置、方法或步骤。

Claims (29)

1.一种检测组件的绑定组中的通信组件的故障的方法,所述方法包括:
将数据路由至与所述绑定组中的其它通信组件共享至少一个网际协议地址的通信组件,其中,路由所述数据应当激活所述通信组件的至少一部分;
监控所述通信组件的所述至少一部分,以便确定所监控的响应于通信的活动级别;
将所监控的活动级别与预定的活动级别进行比较;以及
如果所监控的活动级别小于预定的活动级别,则将所述通信组件标记为出故障的组件。
2.根据权利要求1的方法,其进一步包括确定在路由echo命令后所流逝的时间,其中,所述数据包括所述echo命令,并且标记包括:如果在所流逝的时间期间没有接收到对所述echo命令的应答,则将所述通信组件标记为出故障的组件。
3.根据权利要求1的方法,其进一步包括解除激活所述出故障的组件。
4.根据权利要求1的方法,其进一步包括激活备用组件来替换所述出故障的组件。
5.根据权利要求1的方法,其进一步包括传输所述出故障的组件的通知。
6.根据权利要求1的方法,其中路由包括:如果所述通信组件的所监控的活动级别在预定义的时间周期期间低于所述预定的活动级别,则路由所述通信。
7.根据权利要求1的方法,其中路由包括:路由具有与所述通信组件关联的媒体访问控制地址的分组。
8.根据权利要求1的方法,其中路由包括:路由具有指示与所述通信组件关联的目的地的媒体访问控制地址的分组。
9.根据权利要求1的方法,其中路由包括:在预定的时间间隔处路由所述数据。
10.根据权利要求1的方法,其中路由包括:当所述通信组件空闲时路由所述通信。
11.根据权利要求1的方法,其中监控包括:检测传送活动和接收活动中的至少一个。
12.一种被配置以便检测故障的装置,所述装置包括:
通信业务生成器,其适于生成至少一个分组以便启动经由组件的绑定组中的通信组件而被路由的数据传输,其中,所述组件的绑定组被配置以便分担与至少一个网络地址相关的数据传输活动;
活动监控器,其检测所述通信组件响应于所述至少一个分组而被监控的活动级别;以及
活动比较器,其将所监控的活动级别与预定的活动级别进行比较,以便确定是否标识所述通信组件为出故障的组件。
13.根据权利要求12的装置,其进一步包括组件标记器,以便如果所述活动监控器检测到小于预定的活动级别,则所述组件标记器将所述通信组件标记为出故障的组件。
14.根据权利要求12的装置,其进一步包括存储所监控的活动级别的寄存器。
15.根据权利要求12的装置,其进一步包括处理器,所述处理器控制至少一个定时器、所述通信业务生成器、所述活动监控器和所述活动比较器。
16.根据权利要求12的装置,其中所述至少一个分组包括测试分组,其具有所述通信组件的目的地媒体访问控制地址。
17.根据权利要求12的装置,其中所述通信组件是以太网适配器。
18.根据权利要求12的装置,其进一步包括备用组件。
19.根据权利要求12的装置,其中所述活动包括传送和接收活动。
20.一种检测绑定适配器中的网络适配器的故障的装置,所述装置包括:
定时模块,其限定时间间隔;
活动监控器,其确定网络适配器在所述时间间隔期间的活动级别并且监控所述网络适配器响应于至少一个测试分组的活动;
活动比较器,其将所确定的活动级别与预定的活动级别进行比较,以便如果所确定的活动小于所述预定的活动级别,则将所述网络适配器标识为可疑适配器;
通信业务生成器,其向所述可疑适配器传送至少一个测试分组;以及
标记器,如果所监控的活动小于与所述至少一个测试分组关联的所预计的活动,则所述标记器将所述可疑适配器标记为出故障的适配器。
21.根据权利要求20的装置,其进一步包括基于所述网络适配器的故障来修改地址分派表的处理器。
22.根据权利要求20的装置,其中,所述网络适配器包括维护寄存器中的分组接收的计数的逻辑。
23.根据权利要求20的装置,其中,所述监控器检测在传送所述至少一个测试分组后所述网络适配器的活动,并且如果没有检测到所述网络适配器响应于所述至少一个测试分组的活动,则将所述网络适配器标记为出故障的适配器。
24.一种系统,其包括:
分担数据传输负载的绑定适配器;
耦合于所述绑定适配器的故障检测逻辑,其检索指示数据传输活动的第一值,基于所述值来标识可疑适配器,经由所述可疑适配器来传输测试分组,检索指示经由所述可疑适配器的数据传输活动的第二值,以及基于所述第二值来确定是否将所述可疑适配器标记为出故障的适配器。
25.根据权利要求24的系统,其中所述故障检测逻辑进一步包括:用于解除激活所述出故障的适配器的标记器。
26.根据权利要求25的系统,其中,所述标记器适于激活备用适配器来替换所述出故障的适配器。
27.根据权利要求24的系统,其中,所述故障检测逻辑能够与另一故障检测逻辑进行通信以便标识所述出故障的适配器。
28.一种包括计算机可用介质的计算机程序产品,所述计算机可用介质具有计算机可读程序,其中当在计算机上执行所述计算机可读程序时,其使得所述计算机:
将数据路由至与绑定组中的其它通信组件共享至少一个网际协议地址的通信组件,其中,路由所述数据应当激活所述通信组件的至少一部分;
监控所述通信组件的所述至少一部分,以便确定所监控的响应于通信的活动级别;
将所监控的活动级别与预定的活动级别进行比较;以及
如果所监控的活动级别小于预定的活动级别,则将所述通信组件标识为出故障的组件。
29.根据权利要求28的计算机程序产品,其中,当在计算机上执行所述计算机可读程序时,其进一步使得所述计算机激活备用组件来替换所述出故障的组件。
CNA2007800099119A 2006-05-01 2007-04-26 在包括绑定适配器的通信网络中检测故障的方法和装置 Pending CN101406004A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/380,993 2006-05-01
US11/380,993 US7743129B2 (en) 2006-05-01 2006-05-01 Methods and arrangements to detect a failure in a communication network

Publications (1)

Publication Number Publication Date
CN101406004A true CN101406004A (zh) 2009-04-08

Family

ID=38372442

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800099119A Pending CN101406004A (zh) 2006-05-01 2007-04-26 在包括绑定适配器的通信网络中检测故障的方法和装置

Country Status (4)

Country Link
US (2) US7743129B2 (zh)
CN (1) CN101406004A (zh)
TW (1) TWI422189B (zh)
WO (1) WO2007125080A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106470120A (zh) * 2015-08-20 2017-03-01 通用汽车环球科技运作有限责任公司 可配置的通信模块
CN107078920A (zh) * 2014-08-26 2017-08-18 T移动美国公司 跨层链路故障警告

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8312120B2 (en) 2006-08-22 2012-11-13 Citrix Systems, Inc. Systems and methods for providing dynamic spillover of virtual servers based on bandwidth
US8493858B2 (en) 2006-08-22 2013-07-23 Citrix Systems, Inc Systems and methods for providing dynamic connection spillover among virtual servers
US7913105B1 (en) * 2006-09-29 2011-03-22 Symantec Operating Corporation High availability cluster with notification of resource state changes
US7929448B2 (en) * 2006-10-17 2011-04-19 Verizon Patent And Licensing Inc. Monitoring link aggregation links
US8166156B2 (en) * 2006-11-30 2012-04-24 Nokia Corporation Failure differentiation and recovery in distributed systems
JP5318875B2 (ja) * 2007-09-13 2013-10-16 アクセディアン・ネットワークス・インコーポレーテッド 非試験トラフィックに影響を与えることなくイーサネット(登録商標)経路およびリンクを試験するためのシステム
US8867377B2 (en) * 2007-10-11 2014-10-21 Cisco Technology, Inc. Dynamic selection between active and passive probing in computer network
US8295163B1 (en) * 2007-11-16 2012-10-23 Marvell International Ltd. Reassigning signals to cable channels
US8331235B2 (en) 2008-12-08 2012-12-11 At&T Intellectual Property I, L.P. Systems and methods to rerouting internet protocol traffic based on network user preferences
US8098572B2 (en) * 2009-02-03 2012-01-17 Google Inc. Interface monitoring for link aggregation
US9454444B1 (en) 2009-03-19 2016-09-27 Veritas Technologies Llc Using location tracking of cluster nodes to avoid single points of failure
US8213296B2 (en) * 2009-05-14 2012-07-03 Verizon Patent And Licensing Inc. Link aggregation protection
US20110004589A1 (en) * 2009-07-06 2011-01-06 Rockwell Automation Technologies, Inc. Diagnostics in a distributed directory system
US8248954B2 (en) * 2009-08-31 2012-08-21 Hubbell Incorporated System and method for enhancement of Ethernet link loss forwarding
JP5033856B2 (ja) * 2009-10-20 2012-09-26 株式会社日立製作所 ネットワーク構成の想定のための装置、システム
US8724465B2 (en) * 2009-10-28 2014-05-13 International Business Machines Corporation Zero packet loss energy efficient ethernet link transition via driver fast failover
US8458515B1 (en) 2009-11-16 2013-06-04 Symantec Corporation Raid5 recovery in a high availability object based file system
US8774010B2 (en) * 2010-11-02 2014-07-08 Cisco Technology, Inc. System and method for providing proactive fault monitoring in a network environment
US8495323B1 (en) 2010-12-07 2013-07-23 Symantec Corporation Method and system of providing exclusive and secure access to virtual storage objects in a virtual machine cluster
US9385917B1 (en) 2011-03-31 2016-07-05 Amazon Technologies, Inc. Monitoring and detecting causes of failures of network paths
US8762546B2 (en) 2011-12-13 2014-06-24 Motorola Mobility Llc Method and apparatus for adaptive network heartbeat message for TCP channel
EP2856690B1 (en) 2012-06-01 2020-12-02 BlackBerry Limited Universal synchronization engine based on probabilistic methods for guarantee of lock in multiformat audio systems
US9479275B2 (en) * 2012-06-01 2016-10-25 Blackberry Limited Multiformat digital audio interface
CN102821008A (zh) * 2012-08-07 2012-12-12 三一重型装备有限公司 一种通信数据监控设备
US8937870B1 (en) * 2012-09-11 2015-01-20 Amazon Technologies, Inc. Network link monitoring and testing
KR101772037B1 (ko) 2012-10-22 2017-08-28 인텔 코포레이션 고성능 상호연결 물리 계층
TWI497968B (zh) * 2012-12-25 2015-08-21 Wistron Neweb Corp 網路傳輸檢查裝置以及網路傳輸檢查方法
US9742638B1 (en) 2013-08-05 2017-08-22 Amazon Technologies, Inc. Determining impact of network failures
US9560100B1 (en) 2015-03-19 2017-01-31 Action Streamer, LLC Method and system for stabilizing and streaming first person perspective video
US9826013B2 (en) 2015-03-19 2017-11-21 Action Streamer, LLC Method and apparatus for an interchangeable wireless media streaming device
WO2017065734A1 (en) * 2015-10-12 2017-04-20 Hewlett Packard Enterprise Development Lp Pluggable communication devices
JP6724583B2 (ja) * 2016-06-15 2020-07-15 富士通株式会社 情報処理装置、情報処理方法、プログラム及び情報処理システム
US10291500B2 (en) 2017-01-23 2019-05-14 International Business Machines Corporation Network interface port management
US10445220B2 (en) * 2017-01-25 2019-10-15 Verizon Patent And Licensing Inc. System and methods for application activity capture, error identification, and error correction

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774640A (en) 1991-10-21 1998-06-30 Tandem Computers Incorporated Method and apparatus for providing a fault tolerant network interface controller
US5663950A (en) 1995-04-27 1997-09-02 International Business Machines Corporation Methods and systems for fault isolation and bypass in a dual ring communication system
US5664219A (en) 1995-06-12 1997-09-02 International Business Machines Corporation Method and system for controlling servicability of adapters connected by an I/O channel interface to a computer system
US6049825A (en) * 1997-03-19 2000-04-11 Fujitsu Limited Method and system for switching between duplicated network interface adapters for host computer communications
US6108300A (en) 1997-05-02 2000-08-22 Cisco Technology, Inc Method and apparatus for transparently providing a failover network device
US6314525B1 (en) 1997-05-13 2001-11-06 3Com Corporation Means for allowing two or more network interface controller cards to appear as one card to an operating system
US6049528A (en) * 1997-06-30 2000-04-11 Sun Microsystems, Inc. Trunking ethernet-compatible networks
US6735679B1 (en) 1998-07-08 2004-05-11 Broadcom Corporation Apparatus and method for optimizing access to memory
US6108200A (en) 1998-10-13 2000-08-22 Fullerton; Robert L. Handheld computer keyboard system
US6078957A (en) * 1998-11-20 2000-06-20 Network Alchemy, Inc. Method and apparatus for a TCP/IP load balancing and failover process in an internet protocol (IP) network clustering system
KR20000054938A (ko) 1999-02-01 2000-09-05 서평원 이더넷 정합장치의 패킷 처리장치 및 방법
US6654914B1 (en) * 1999-05-28 2003-11-25 Teradyne, Inc. Network fault isolation
US6601195B1 (en) 1999-09-09 2003-07-29 International Business Machines Corporation Switch adapter testing
US6868062B1 (en) * 2000-03-28 2005-03-15 Intel Corporation Managing data traffic on multiple ports
US6760859B1 (en) 2000-05-23 2004-07-06 International Business Machines Corporation Fault tolerant local area network connectivity
US6539338B1 (en) 2000-06-09 2003-03-25 3Com Corporation Self-diagnostic testing of a network interface adapter
JP3654158B2 (ja) 2000-08-09 2005-06-02 日本電気株式会社 パケット転送経路制御装置及びそれに用いるパケット転送経路制御方法
US6639338B1 (en) * 2000-09-06 2003-10-28 Lambert Haner Controlled reluctance AC induction motor
WO2002092829A1 (fr) * 2001-05-17 2002-11-21 Takeda Chemical Industries, Ltd. Procede de production d'un peptide
US7203748B2 (en) 2002-02-15 2007-04-10 International Business Machines Corporation Method for detecting the quick restart of liveness daemons in a distributed multinode data processing system
US7167912B1 (en) * 2002-08-09 2007-01-23 Cisco Technology, Inc. Method and apparatus for detecting failures in network components
US20040165525A1 (en) 2003-02-10 2004-08-26 Invensys Systems, Inc. System and method for network redundancy
US20050010837A1 (en) * 2003-07-10 2005-01-13 International Business Machines Corporation Method and apparatus for managing adapters in a data processing system
US7188273B2 (en) * 2003-11-24 2007-03-06 Tsx Inc. System and method for failover
US20050144287A1 (en) * 2003-12-11 2005-06-30 International Business Machines Corporation Computer product and system for establishing network connections
DE112004002797B4 (de) * 2004-03-19 2015-12-31 Zakrytoe Aktsionernoe Obschestvo "Intel A/O" Ausfallsicherung und Lastausgleich
US7760626B2 (en) * 2004-03-31 2010-07-20 Intel Corporation Load balancing and failover
US7506214B2 (en) * 2004-04-22 2009-03-17 International Business Machines Corporation Application for diagnosing and reporting status of an adapter
US7552365B1 (en) * 2004-05-26 2009-06-23 Amazon Technologies, Inc. Web site system with automated processes for detecting failure events and for selecting failure events for which to request user feedback
US7275175B2 (en) * 2004-07-22 2007-09-25 International Business Machines Corporation Method and apparatus for high-speed network adapter failover
US20060039276A1 (en) 2004-08-18 2006-02-23 International Business Machines Corporation Failback to a primary communications adapter
JP4387968B2 (ja) * 2005-03-28 2009-12-24 富士通株式会社 障害検出装置および障害検出方法
US7872965B2 (en) * 2005-08-01 2011-01-18 Hewlett-Packard Development Company, L.P. Network resource teaming providing resource redundancy and transmit/receive load-balancing through a plurality of redundant port trunks

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107078920A (zh) * 2014-08-26 2017-08-18 T移动美国公司 跨层链路故障警告
CN107078920B (zh) * 2014-08-26 2020-08-18 T移动美国公司 跨层链路故障警告
CN106470120A (zh) * 2015-08-20 2017-03-01 通用汽车环球科技运作有限责任公司 可配置的通信模块
CN106470120B (zh) * 2015-08-20 2020-04-10 通用汽车环球科技运作有限责任公司 用于在车辆中提供无线通信和远程信息处理的系统

Also Published As

Publication number Publication date
TW200805945A (en) 2008-01-16
TWI422189B (zh) 2014-01-01
US20070255819A1 (en) 2007-11-01
US20080225733A1 (en) 2008-09-18
WO2007125080A1 (en) 2007-11-08
US7743129B2 (en) 2010-06-22
US7765290B2 (en) 2010-07-27

Similar Documents

Publication Publication Date Title
CN101406004A (zh) 在包括绑定适配器的通信网络中检测故障的方法和装置
US8806007B2 (en) Inter-node communication scheme for node status sharing
JP5656799B2 (ja) 適切なアラートの配信方法、システムおよびコンピュータ・プログラム
KR20050037606A (ko) 컴퓨터 기반 방법, 컴퓨터 프로그램 제품 및 데이터 처리시스템
JP4695705B2 (ja) クラスタシステムおよびノード切り替え方法
CN101013971A (zh) 提供使用最少带宽的故障检测的方法和系统
CN111162880B (zh) 数据发送方法、装置、设备及存储介质
EP1661367B1 (en) Packet sniffer
CN105849702A (zh) 集群系统,服务器设备,集群系统管理方法和计算机可读记录介质
WO2014091663A1 (en) Detecting and isolating dropped or out-of-order packets in communication networks
KR20160023873A (ko) 하드웨어 관리 통신 프로토콜
CN110247823A (zh) 一种故障检测方法、装置及相关设备
JPH07183905A (ja) 遠隔監視システム
US6732212B2 (en) Launch raw packet on remote interrupt
CN106502944A (zh) 计算机、pcie设备以及pcie设备的心跳检测方法
CN101127580B (zh) 节点装置、控制装置和控制方法
CN111652681A (zh) 一种单据处理方法、服务器及计算机可读存储介质
KR102018225B1 (ko) 연결 방법
US7512776B2 (en) Optimized control plane signalling for a high availability network device in a communications network
US20110161741A1 (en) Topology based correlation of threshold crossing alarms
CN108880994B (zh) 一种重发邮件的方法和装置
CN106452869B (zh) 一种管理一卡通终端的方法
CN106452677A (zh) 一种数据传输方法、装置及系统
JP2002163181A (ja) ファイル転送システム及びファイル転送方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20090408