CN1606002A - 产生将计算机故障存档的事故单的系统和方法 - Google Patents

产生将计算机故障存档的事故单的系统和方法 Download PDF

Info

Publication number
CN1606002A
CN1606002A CNA2004100705390A CN200410070539A CN1606002A CN 1606002 A CN1606002 A CN 1606002A CN A2004100705390 A CNA2004100705390 A CN A2004100705390A CN 200410070539 A CN200410070539 A CN 200410070539A CN 1606002 A CN1606002 A CN 1606002A
Authority
CN
China
Prior art keywords
correction action
trouble ticket
diagnostic process
fault
data handling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2004100705390A
Other languages
English (en)
Inventor
R·W·切斯顿
D·C·克罗默
R·A·达扬
H·J·洛克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Singapore Pte Ltd
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1606002A publication Critical patent/CN1606002A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0784Routing of error reports, e.g. with a specific transmission path or data flow
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Abstract

数据处理系统服务包括使得系统响应系统故障执行诊断处理和使得系统在自动诊断处理期间执行试图排除系统故障的纠正动作。这种服务还包括将系统配置成产生一个含有表征所述系统故障和任何所尝试的纠正动作的事故单,无论所述纠正动作在排除系统故障中奏效与否。还可以使得系统将事故单转送给一个外部数据库进行分析和访问外部数据库以确定检测到的故障先前是否遇到过。系统可以被划分成包括一个诊断分区的两个分区。系统可以在出现故障后或响应用户的请求引导到这个诊断分区。

Description

产生将计算机故障存档的事故单的系统和方法
技术领域
本发明属于数据处理系统技术领域,具体地说属于管理数据处理系统故障的技术领域。
背景技术
在数据处理系统领域,使客户机系统的管理自动化是降低用户的总拥有成本的关键因素。自主修复(autonomic repair)出故障的系统是自动客户机管理的一个重要部分。自主修复的目的是在出现问题时解决问题而不需要用户干预,以及或许更重要的是,不用启动帮助台电话呼叫或现场服务事件。当前,在遇到一个系统出现了故障而不能通过一个自动化的过程或在简单的用户干预下排除故障时,就启动一个帮助台呼叫。帮助台可以试图指导用户通过一系列诊断步骤来解决问题或更精确地确定问题。如果帮助台呼叫没有解决问题,帮助中心可以根据问题的性质和严重程度将一些新的部件、一台新的计算机递送给用户,甚至可能派遣现场服务技术人员到用户的场所。
计算机及相关服务的厂商和供应商有兴趣保存有关在他们的系统上出现故障的频率和类型的信息。然而,通常得到报告的数据是偏颇的,偏向于需要帮助台干预、现场服务干预或者这两者的事件。具体地说,由于可能有许多问题在启动帮助台呼叫之前已由系统自行纠正,因此帮助台呼叫的样本可能代表不了现场出现的各种故障模式的类型及其相应频率。所希望的是实现一种方法和系统,其使数据处理供应商能监视和分析最经常使他们的系统出现故障的机理,无论这些故障是否最终需要进行帮助台呼叫之类。还希望所实现的解决方案不显著增加拥有和/或操作相应数据处理系统的成本或复杂性。
发明内容
上述目的按照本发明的一个实施例主要是通过使一个数据处理系统和网络能将不只是需要外部干预的故障而且还有可以在本地在有或没有用户干预的情况下确定或修复的那些故障记入日志来达到的。在一个实施例中,用户的数据处理系统配置有至少两个引导映像(boot image)。第一引导映像包括系统的正常操作系统,而第二引导映像包括一个自动调试或诊断例程。如果出现一个诸如OS崩溃之类的系统故障,系统可以被引导进入诊断模式,然后执行适合于这个系统的诊断程序,并记录表示各个诊断测试的结果的数据。该诊断工具于是可以确定检测到的问题(如果有的话)是否可以本地纠正。如果问题可以本地解决,系统就可以调用自动纠正动作,试图修复系统。自动纠正动作可以包括诸如重新引导系统和下载一个或多个计算机软件(例如,软件驱动程序)、将映像恢复到一个已知的良好状态或访问一个存有先前对于类似问题的解决情况的知识数据库之类的动作。
无论响应诊断程序而最终所采取的是什么动作,这个动作是否包括一个帮助台呼叫或其他外部事件,都产生一个事故单(trouble ticket),将与这故障有关的信息存档。事故单然后被转送事故单信息数据库并存储在其中,于是就可以对事故单进行分析,得出包括最经常出现的故障的类型和调试程序在本地纠正故障中的效能的信息。本发明按照一个实施例实现为一种由一个或多个第三方提供的服务。在本发明的这个实施例中,数据处理商品和/或服务的供应商为用户提供自动诊断代码,然后接收和监视系统产生的事故单以指导供应商修改这个自动化的软件以进一步减少帮助中心呼叫和/或现场服务事件,就有关为了改善系统的可用性而可以进行的改变向用户提供建议,或者这些的组合。
附图说明
本发明的其他目的和优点从以下结合附图所作的详细说明中可以清楚看出,在这些附图中:
图1为示出在结合本发明的一个实施例中所用的一个数据处理网络的一些所选组成部分的方框图;
图2为在按照本发明的一个实施例设计的数据处理系统中的自主故障修复方法的流程图;
图3为着重示出利用图1的数据处理系统和网络为用户提供自主故障纠正和分析服务的流程图;以及
图4为示出按照本发明的实施例设计的图1的数据处理系统的配置的流程图,着重示出系统在出现一个系统故障后引导入自动诊断模式的能力。
虽然本发明可以有各种修改和可替代的形式,但在附图中只例示了本发明的一些具体实施例并在下面就此予以详细说明。然而,应该理解,在这里给出的这些附图和详细说明不是用来将本发明限制在所揭示的这些具体实施例,而是用来涵盖在如所附权利要求书所给出的本发明的精神实质和专利保护范围内的所有修改的、等效的和替代的实施方式。
具体实施方式
概括地说,本发明考虑的是利用数据处理系统的自动或自主故障管理的系统和方法。用户的数据处理系统配置成包括至少两个引导映像(即,至少两个在系统复位和/或系统加电后的工作模式)。第一引导映像表示系统的常规操作系统(OS),而第二引导映像是在系统出现故障后调用的诊断映像。诊断映像配置成在系统上运行一个诊断程序,以得到有关故障原因的信息和试图采取纠正动作。纠正动作可以是自动的,可以需要用户输入,也可以是这两者相结合的。诊断程序产生一个包括与使系统出现故障的原因有关的信息的记录(在这里称为事故单)。也可能诊断程序向用户询问与故障有关的信息,以帮助确定正确的纠正动作。在本发明的一个重要方面,诊断程序配置成对于需要其他支持(诸如帮助台呼叫或现场服务呼叫)的事件和对于纠正动作奏效的事件都产生事故单。通过提供对于自动修复的事件和对于需要其他支持的事件的事故单,本发明改善了服务供应商和他的用户确定在系统上出现的事件的类型的能力,而且提高了被设计成在出现故障时排除故障的自动化软件的效能。
现在来看这些附图,图中示出了可以在其上有益地应用本发明的一个有代表性的数据处理网络100中的所选的一些组成部分。所示的这个网络包括一个局域网(LAN)102,它通过网关设备130与广域网(WAN)106连接。所示出的还有连接到WAN 106上的外部服务器140和数据库142,外部供应商可以通过WAN 106为LAN 102安装、配置或提供自动数据处理修复功能。
在所示的这个实施例中,LAN 102表示一个企业的数据处理网络。LAN102包括一系列服务器120A至120D(总称为服务器120),各种设备和系统连接到这些服务器上。服务器120A和120B都连接到一组数据处理系统125A至125D。每个数据处理系统125表示一个诸如台式或笔记本式个人计算机、网络计算机之类的基于微处理器的数据处理系统。LAN 102还示为包括一个与网络的盘存储装置连接的服务器120C和一个提供为数据处理系统125所能访问的应用132的应用服务器120D。这组服务器120示为通过网络媒体135连接到一个网关设备130上。LAN 102和网络媒体135可以实现为和遵从于如在IEEE标准802.3中规定的以太网。图1这种配置当然只是可用来说明本发明的一些方面的一个可能的典型网络的例示。熟悉局域网和企业系统设计的人员可以理解,下面所说明的这些创造性的构思可以应用于其他配置而具有同样的效果。
本发明的实质性部分可以实现为一组计算机可执行指令或计算机可执行指令的一个序列(即,计算机软件)。在这样的实施例中,软件可以存储在多种计算机可读媒体中任何一种上,这些计算机可读媒体包括诸如磁盘和/或磁带、软盘驱动器、CD ROM、闪速存储器、ROM之类。在软件的一些部分执行期间,这些指令也可以存储在系统存储器(DRAM)内,或存储在内部或外部的高速缓冲存储器(SRAM)内。
现在来看图2,图中示出了在一个诸如图1的数据处理系统125之类的数据处理系统上执行自动故障分析的方法200的一些所选步骤的流程图。在所示这个实施例中,方法200包括一个初始方框(方框202),在此一个代表性的数据处理系统125在它的正常工作状态下发挥功能和运行。
系统125一直保持在这个正常工作状态,直到检测到一个故障(方框204)。在方框204中检测到的故障的典型例子为使系统完全或基本上不能工作的操作系统崩溃或者故障。在方框204中可以检测到的其他故障包括系统各个组成部分产生的硬件中断。在方框204中检测到一个故障时,系统125进入或调用(方框206)一个自动调试例程或代理。也可能的是,用户可以判定系统125工作不正常,进而手动启动自动调试例程或代理。
本发明的一个实施例依赖于存在一个存储在系统125上的系统BIOS、诸如CD之类的可引导设备和/或硬盘驱动器的保护区内的可引导调试或诊断例程。在发生系统故障后就调用这个可引导调试例程。在这个实施例中,如图4这个流程图更详细示出的那样,系统125由用户或由第三方服务供应商配置成具有双引导映像。第一引导映像是系统的正常操作系统,而第二映像是自动调试例程。
在图4所示的这个实施例中,系统125对系统复位的发生进行监视或检测(方框402)。在检测到复位后,系统125于是确定(方框404)故障标志或其他适当的系统故障指示是否已经设置。如果故障标志已设置,系统125就引导本身至自动调试配置(方框406)。如果故障标志没有设置,从而表明这个电复位不是系统故障引起的,系统125引导(方框408)它的正常操作系统映像,并继续正常运行,直到发现下一个复位。也可能的是用户强迫系统引导到自动调试配置。这可以用多种方式实现,包括让用户来设置故障标志和/或有允许用户选择的引导菜单,或者在加电时有一个键序列强迫引导到自动调试配置。
在方框406中将一个出现故障的系统引导入自动调试映像后,执行自动调试代码(方框410)。该自动调试程序可以执行各种系统诊断例程,并且然后可以试图采取纠正动作(方框412)。这个纠正动作可以包括执行自动关机和重新引导、删除怀疑含有病毒的代码段、检验系统配置和解决任何配置冲突、运行综合系统诊断例程、整理系统硬盘驱动器碎片、将硬盘驱动器恢复到已知的良好状态和/或检测网络设置的修改。作为一个例子,可以采用一个诸如Rapid Restore PC(快速恢复PC)之类的恢复实用程序帮助将一个驱动器恢复到已知的良好状态。这个程序也可以向用户询问与故障有关的信息和用这信息指导用户进行可能的修复和/或根据一个知识数据库确定修复。
系统125采取了任何纠正动作后,产生一个“事故单”(方框414)。事故单414包括涉及故障的时间和原因、系统的序号或其他跟踪信息、所采取的纠正动作的性质和纠正动作奏效与否的信息。重要的是,注意到无论系统125所采取的任何纠正动作奏效与否,都由系统125产生事故单。因此,即使纠正动作在解决引起故障的问题中有效,也仍然产生一个事故单,来将可纠正的故障的发生和实现成功修复所用的手段存档。
所产生的事故单然后被转送一个系统支持/系统帮助区。系统支持区在图1表示为外部服务器140和数据库142。在其他实施例中,事故单信息被本地存储在发生故障的系统本身内或者存储在LAN存储装置内某处。本地存储信息可以有利地帮助在随后的调试努力期间的自动调试代理。例如,如果系统未通过一个先前未通过的特定检验,那末本地存储事故单信息可以有助于自动调试代理确定这个故障先前是否出现过,以及如果出现过,先前在解决这个问题中什么动作是有效的。该信息可用于按优先次序排列出解决当前冲突所要采取的动作。用这样的方式,本地存储事故单信息可以使一系统在采取费时的、先前解决类似问题没有奏效的纠正动作之前能执行正确的纠正。也可能的是可以定期地用服务器副本更新本地数据库,从而可以获得对与它类似的所有系统的所有问题的解决办法的益处。在客户机空间中,有可能存在数百万的类似系统,因此很可能一类似的系统先前出现过类似问题,而纠正动作已经知道并已存储在数据库内。
如果自动调试例程采取的纠正动作在解决这个故障中是有效的,如在方框416中所确定的,系统被重新引导(方框420)入它的正常操作系统,并重新开始正常运行。如果纠正动作没能找到这个问题的原因,系统可能停机和/或在非最佳状态下运行(方框418),直到帮助中心能通过发送纠正软件、发送更换部件或者适当的话启动现场服务呼叫来解决这个问题。
现在返回图2,在执行自动调试例程后确定使系统125发生故障的问题是否已得到纠正(方框208)。如上所述,方法200包括产生一个事故单,无论导致问题的故障是否还在。如果自动调试例程没有解决问题,就产生一个包括与故障有关的信息的“标准”事故单(方框210)。如果故障被自动调试例程纠正,就产生一个“非干预”事故单(方框212)。非干预事故单除故障源或故障性质之外还包括在消除故障中有效的诊断纠正动作以及一个正常事故单的所有信息。
无论在消除故障中任何所采取的纠正动作奏效与否,响应故障而产生的事故单都转送一个支持区(可以是在本地和/或外部)(方框214)。事故单于是被存储(方框216)在一个事故单数据库内供以后分析。系统管理员于是可以访问和操作数据库,确定出现的是什么类型的故障以及哪些纠正动作(如果有的话)在消除故障中是有用的。作为另一个例子,数据库信息可用来按照最常遇到的故障对纠正措施进行排序,以更快解决问题。
在图3这个流程图所着重示出的实施例中,本发明实现为一个由一个或多个供应商为数据处理用户提供的服务。具体地说,图3这个流程图示出了为用户提供自动诊断服务的方法300。在所示的这个实施例中,该方法300包括一初始步骤,在此为一用户提供自动调试代理(方框302)。提供这个软件可以包括安装这个软件和/或配置用户的系统125,以便正确地进入和执行调试功能。在其他实施例中,与该自动调试例程相关联的安装和/或配置由用户执行。在图3这个流程图所着重示出的实施例中,调试功能的提供者也是调试支持服务的提供者。在这个实施例中,该提供者被配置成对接收由用户的系统产生的事故单进行检测(方框304)。
返回看一下图1,自动调试功能和服务的提供者表示为外部服务器140和外部数据库142。如图1所示,外部服务器140可通过一个诸如因特网之类的广域网由LAN 102访问。在这种实现方式中,外部服务器140配置成将自动调试功能提供给LAN 102上的系统125。提供这个功能可以用与在传统与网络连接的系统中进行BIOS和其他固件更新类似的方式实现。在其他实施例中,将系统125配置成包括自动调试功能可能需要进行本地操作,诸如由本地技术人员或系统管理员将一CD或其他媒体插入适当的系统和引导这个系统之类。也可能的是配置系统以将自动调试功能本有地添加到系统。这是可以从网络或一CD或USB外部设备运行的一次性准备步骤。它将留出部分硬盘驱动器,并将自动调试功能复制到驱动器上。
检测到接收到一个事故单后,调试服务提供者将事故单信息存储(方框306)在诸如图1中所示的数据库142之类的数据库内。然后,自动调试服务提供者可以不时对事故单数据库进行分析(方框308),以将用户的系统的主要故障模式存档和评估自动调试例程各个部分的效用。作为这种分析的结果,自动调试服务提供者可以修改其自动调试软件,例如删去调试中在解决一个问题上很少奏效的部分,添加对付当前还没有对付的故障造成模式的功能,等等。这样,自动调试服务的提供者可以提高用户的数据处理系统检测和纠正它们自己的故障的能力,从而改善系统可用性和降低系统维护费用。
熟悉该技术领域的人员从这里所公开的可以看到本发明考虑的是数据处理系统的自动故障管理。可以理解,在详细说明和附图中所示出和描述的本发明的形式只应视为目前优选的例子。以下权利要求书旨在被广义地解释以包括所公开的这些优选实施例的所有变形。

Claims (20)

1.一种自动数据处理系统管理服务方法,所述方法包括以下步骤:
使得一数据处理系统响应检测到一系统故障而执行诊断处理;
使得所述系统在所述自动诊断处理期间执行纠正动作,以试图排除所述系统故障;以及
将所述系统配置成产生含有表征所述系统故障和任何所尝试的纠正动作的信息的事故单,无论所述纠正动作在排除所述系统故障中奏效与否。
2.权利要求1的方法,所述方法还包括使得所述数据处理系统响应来自怀疑有系统故障的用户的请求而执行所述诊断处理。
3.权利要求1的方法,其中使得所述系统执行诊断处理还具有的特征是将所述数据处理系统配置成具有一个操作分区和一个能执行所述诊断处理的诊断分区,以及将所述数据处理系统配置成响应所述系统故障引导所述诊断分区。
4.权利要求1的方法,所述方法还包括使得所述系统将所述事故单转送给一个外部数据库。
5.权利要求4的方法,其中使得所述系统执行诊断处理和纠正动作还具有的特征是使得所述系统访问所述外部数据库,以确定所检测到的故障是否先前遇到过。
6.权利要求4的方法,所述方法还将所述系统配置成使一用户可以分析所述外部数据库,以确定从各种故障模式的频率和纠正动作在排除故障中的效能中选择的一特征。
7.权利要求1的方法,其中所述诊断处理和纠正动作包括请求指导所述诊断处理和纠正动作的用户输入。
8.一种包括存储在计算机可读媒体上的用来诊断数据处理系统的计算机可执行指令的计算机程序产品,所述计算机程序产品包括:
用于响应从怀疑有一系统故障的一用户请求所述诊断处理的事件和所述系统检测到一故障的事件中选择的一事件,执行诊断处理的计算机代码单元;
用于执行试图排除所述故障的纠正动作的计算机代码单元;以及
用于产生标识所述系统、表征所述故障和标识所采取的纠正动作和所述纠正动作奏效与否的一事故单的计算机代码单元,无论所述纠正动作奏效与否所述用于产生所述事故单的代码单元都会执行。
9.权利要求8的计算机程序产品,所述计算机程序产品还包括用于响应所述事件引导所述数据处理系统中含有所述诊断处理代码单元的诊断分区的代码单元。
10.权利要求8的计算机程序产品,所述计算机程序产品还包括将所述事故单转给一外部数据库的代码单元。
11.权利要求10的计算机程序产品,其中所述诊断处理和纠正动作代码单元包括用于访问所述外部数据库以确定所述系统故障先前是否遇到过的代码单元。
12.权利要求11的计算机程序产品,所述计算机程序产品还包括用于在所述问题先前遇到过时至少部分根据所述外部数据库按优先次序排列出所述纠正动作序列的代码单元。
13.权利要求10的计算机程序产品,所述计算机程序产品还包括用于分析所述外部数据库以确定从各种故障模式的频率和所述纠正动作在排除故障中的效能中选择的一特征的代码单元。
14.一种包括处理器、存储媒体和I/O装置的数据处理系统,所述系统包括:
用于响应一系统故障的一指示执行诊断处理的计算机代码单元;
用于执行排除所述故障的纠正动作的计算机代码单元;以及
用于产生标识所述系统、表征所述故障和标识所采取的纠正动作和所述纠正动作奏效与否的一事故单的计算机代码单元。
15.权利要求14的数据处理系统,其中所述数据处理系统的所述存储媒体包括一个操作分区和一个诊断分区,所述诊断分区包括所述诊断处理代码。
16.权利要求14的数据处理系统,所述数据处理系统还包括将所述事故单转送给一个本地数据库和一个外部数据库的代码单元,其中所述诊断处理代码单元包括用于访问所述外部和本地数据库中至少一个以确定所述系统故障的先前发生和利用所述数据库信息指导要采取的纠正动作的代码单元。
17.一种数据处理系统维护服务方法,所述方法包括以下步骤:
提供能采取纠正动作的诊断处理代码;
使得所述系统响应一系统故障的一指示执行所述诊断代码;
其中,响应排除所述系统故障的所述纠正动作,所述诊断代码产生包括表明所述系统、所述系统故障和所述纠正动作的信息的一事故单,以及将所述事故单转送给一外部数据库,以使所述数据库能监视与本地所排除的系统故障有关的频率、特征和纠正动作。
18.权利要求17的数据处理系统维护服务方法,其中所述诊断代码还将所述事故单存储在一本地数据库内。
19.权利要求17的数据处理系统维护服务方法,其中提供诊断代码还具有以下特征:
将所述系统划分为包括一诊断分区的至少两个分区,所述诊断分区包括所述诊断处理代码,以及
响应所述系统故障的所述指示引导所述诊断分区。
20.权利要求17的数据处理系统维护服务方法,其中所述纠正动作是从一列表中选出的,该列表包括:重新引导所述系统、下载软件驱动程序、将所述系统恢复到最近一个所知的良好状态和访问一个含有指示先前系统故障和纠正动作的信息的数据库。
CNA2004100705390A 2003-10-10 2004-08-03 产生将计算机故障存档的事故单的系统和方法 Pending CN1606002A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/683,242 US20050081118A1 (en) 2003-10-10 2003-10-10 System and method of generating trouble tickets to document computer failures
US10/683,242 2003-10-10

Publications (1)

Publication Number Publication Date
CN1606002A true CN1606002A (zh) 2005-04-13

Family

ID=34422696

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2004100705390A Pending CN1606002A (zh) 2003-10-10 2004-08-03 产生将计算机故障存档的事故单的系统和方法

Country Status (2)

Country Link
US (1) US20050081118A1 (zh)
CN (1) CN1606002A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102341788A (zh) * 2009-04-13 2012-02-01 索尼公司 计算设备的系统维护

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7793233B1 (en) 2003-03-12 2010-09-07 Microsoft Corporation System and method for customizing note flags
CN100363893C (zh) * 2004-03-27 2008-01-23 鸿富锦精密工业(深圳)有限公司 加载系统及方法
US20060101398A1 (en) * 2004-11-01 2006-05-11 Schepers Paul D Program output management
US7484134B2 (en) * 2004-11-23 2009-01-27 Sap Ag Method and system for internet-based software support
US7991850B2 (en) * 2005-07-28 2011-08-02 Advanced Micro Devices, Inc. Resilient system partition for personal internet communicator
US7610512B2 (en) * 2006-01-06 2009-10-27 Hewlett-Packard Development Company, L.P. System and method for automated and assisted resolution of it incidents
TWI317905B (en) * 2006-01-09 2009-12-01 Wistron Corp A method for executing booting process under a abnormal situation and a control chip for booting process
JP4701148B2 (ja) * 2006-03-02 2011-06-15 アラクサラネットワークス株式会社 障害回復システム及びサーバ
US20070245313A1 (en) * 2006-04-14 2007-10-18 Microsoft Corporation Failure tagging
US20080098109A1 (en) * 2006-10-20 2008-04-24 Yassine Faihe Incident resolution
US7624309B2 (en) * 2007-01-16 2009-11-24 Microsoft Corporation Automated client recovery and service ticketing
US7673178B2 (en) * 2007-01-31 2010-03-02 Microsoft Corporation Break and optional hold on failure
US7788540B2 (en) * 2007-01-31 2010-08-31 Microsoft Corporation Tracking down elusive intermittent failures
CN101324860B (zh) * 2007-06-14 2013-08-28 鸿富锦精密工业(深圳)有限公司 主板测试系统及测试方法
US9940582B2 (en) * 2008-08-27 2018-04-10 International Business Machines Corporation Intelligent problem tracking electronic system for optimizing technical support
US8055954B2 (en) * 2008-10-01 2011-11-08 Hewlett-Packard Development Company, L.P. Storage systems and methods for distributed support ticket processing
WO2010050381A1 (ja) * 2008-10-30 2010-05-06 インターナショナル・ビジネス・マシーンズ・コーポレーション 障害イベントの検出を支援する装置、障害イベントの検出を支援する方法及びコンピュータプログラム
US8086900B2 (en) * 2008-12-22 2011-12-27 International Business Machines Corporation System, method and computer program product for testing a boot image
US20100262919A1 (en) * 2009-04-09 2010-10-14 Peter Spezza Method of remotely providing a computer service
CA2668958A1 (en) * 2009-06-12 2010-12-12 Ibm Canada Limited - Ibm Canada Limitee System and method for managing batch production
US7996729B2 (en) * 2009-09-30 2011-08-09 Xerox Corporation Method and system for maintenance of network rendering devices
US9009769B2 (en) * 2010-03-11 2015-04-14 Verizon Patent And Licensing Inc. Automatic detection and remote repair of a television system condition
US8705371B2 (en) * 2010-03-19 2014-04-22 At&T Intellectual Property I, L.P. Locally diagnosing and troubleshooting service issues
US8938749B2 (en) 2010-08-31 2015-01-20 At&T Intellectual Property I, L.P. System and method to troubleshoot a set top box device
US8726095B2 (en) * 2010-12-02 2014-05-13 Dell Products L.P. System and method for proactive management of an information handling system with in-situ measurement of end user actions
US8782730B2 (en) 2010-12-09 2014-07-15 At&T Intellectual Property I, L.P. User assistance via customer premises equipment media files
US9928483B2 (en) * 2011-04-20 2018-03-27 Level 3 Communication, Llc Automated topology change detection and policy based provisioning and remediation in information technology systems
US8898092B2 (en) 2012-01-31 2014-11-25 International Business Machines Corporation Leveraging user-to-tool interactions to automatically analyze defects in it services delivery
US9483344B2 (en) 2012-04-05 2016-11-01 Assurant, Inc. System, method, apparatus, and computer program product for providing mobile device support services
US9413893B2 (en) 2012-04-05 2016-08-09 Assurant, Inc. System, method, apparatus, and computer program product for providing mobile device support services
US10198304B2 (en) * 2014-11-04 2019-02-05 Oath Inc. Targeted crash fixing on a client device
US10459951B2 (en) * 2016-07-30 2019-10-29 Wipro Limited Method and system for determining automation sequences for resolution of an incident ticket
US10380520B2 (en) * 2017-03-13 2019-08-13 Accenture Global Solutions Limited Automated ticket resolution
US10636006B2 (en) 2017-04-21 2020-04-28 At&T Intellectual Property I, L.P. Methods, devices, and systems for prioritizing mobile network trouble tickets based on customer impact
US11487603B2 (en) * 2017-04-23 2022-11-01 International Business Machines Corporation Cognitive service request construction
US11416344B2 (en) * 2017-10-03 2022-08-16 Rubrik, Inc. Partial database restoration
WO2019217931A1 (en) 2018-05-11 2019-11-14 Lattice Semiconductor Corporation Asset management systems and methods for programmable logic devices
EP3791305A4 (en) * 2018-05-11 2022-04-06 Lattice Semiconductor Corporation KEY DELIVERY SYSTEMS AND METHODS FOR PROGRAMMABLE LOGICAL DEVICES
US10713107B2 (en) * 2018-05-24 2020-07-14 Accenture Global Solutions Limited Detecting a possible underlying problem among computing devices
EP3657408A1 (en) * 2018-11-26 2020-05-27 Siemens Aktiengesellschaft Method for risk-based testing
US11188349B2 (en) 2019-05-03 2021-11-30 Servicenow, Inc. Platform-based enterprise technology service portfolio management
US11231985B1 (en) * 2020-07-21 2022-01-25 International Business Machines Corporation Approach to automated detection of dominant errors in cloud provisions

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4898263A (en) * 1988-09-12 1990-02-06 Montgomery Elevator Company Elevator self-diagnostic control system
US5555295A (en) * 1995-05-16 1996-09-10 At&T Corp. Service and information management system for a telecommunications network
US6768975B1 (en) * 1996-11-29 2004-07-27 Diebold, Incorporated Method for simulating operation of an automated banking machine system
US6279826B1 (en) * 1996-11-29 2001-08-28 Diebold, Incorporated Fault monitoring and notification system for automated banking
US6430286B1 (en) * 1997-04-22 2002-08-06 At&T Corp Service and information management system for a telecommunications network
US6477667B1 (en) * 1999-10-07 2002-11-05 Critical Devices, Inc. Method and system for remote device monitoring
US6931522B1 (en) * 1999-11-30 2005-08-16 Microsoft Corporation Method for a computer using the system image on one of the partitions to boot itself to a known state in the event of a failure
GB2361327A (en) * 2000-04-11 2001-10-17 Mitel Corp Automatically executing instruction sets in response to network error logs
US7111318B2 (en) * 2000-06-02 2006-09-19 Vitale Michael J Communication system work order performance method and system
US7769847B2 (en) * 2000-07-13 2010-08-03 Computer Associates Think, Inc. Method and apparatus for a comprehensive network management system
US7065566B2 (en) * 2001-03-30 2006-06-20 Tonic Software, Inc. System and method for business systems transactions and infrastructure management
US6804665B2 (en) * 2001-04-18 2004-10-12 International Business Machines Corporation Method and apparatus for discovering knowledge gaps between problems and solutions in text databases
US20020194319A1 (en) * 2001-06-13 2002-12-19 Ritche Scott D. Automated operations and service monitoring system for distributed computer networks
US20030110412A1 (en) * 2001-06-19 2003-06-12 Xerox Corporation System and method for automated printer diagnostics
US20030083838A1 (en) * 2001-10-31 2003-05-01 Barrett Richard M. Wireless test and measurement method
US6661978B2 (en) * 2002-01-16 2003-12-09 Xerox Corporation Method and apparatus for automated job recovery
US7017085B2 (en) * 2002-05-30 2006-03-21 Capital One Financial Corporation Systems and methods for remote tracking of reboot status
US7120633B1 (en) * 2002-07-31 2006-10-10 Cingular Wireless Ii, Llc Method and system for automated handling of alarms from a fault management system for a telecommunications network
US7043419B2 (en) * 2002-09-20 2006-05-09 International Business Machines Corporation Method and apparatus for publishing and monitoring entities providing services in a distributed data processing system
US20040167887A1 (en) * 2002-12-06 2004-08-26 Attensity Corporation Integration of structured data with relational facts from free text for data mining
US7301909B2 (en) * 2002-12-20 2007-11-27 Compucom Systems, Inc. Trouble-ticket generation in network management environment
US7340638B2 (en) * 2003-01-30 2008-03-04 Microsoft Corporation Operating system update and boot failure recovery
US20040255202A1 (en) * 2003-06-13 2004-12-16 Alcatel Intelligent fault recovery in a line card with control plane and data plane separation
US7363528B2 (en) * 2003-08-25 2008-04-22 Lucent Technologies Inc. Brink of failure and breach of security detection and recovery system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102341788A (zh) * 2009-04-13 2012-02-01 索尼公司 计算设备的系统维护

Also Published As

Publication number Publication date
US20050081118A1 (en) 2005-04-14

Similar Documents

Publication Publication Date Title
CN1606002A (zh) 产生将计算机故障存档的事故单的系统和方法
US5704031A (en) Method of performing self-diagnosing hardware, software and firmware at a client node in a client/server system
KR102268355B1 (ko) 클라우드 배치 기반구조 검증 엔진
US7594219B2 (en) Method and apparatus for monitoring compatibility of software combinations
EP1573581B1 (en) Method and apparatus for managing components in an it system
US7043505B1 (en) Method variation for collecting stability data from proprietary systems
US7257743B2 (en) Method and system for reporting failures of a program module in a corporate environment
JP5535484B2 (ja) 自動ソフトウェアテストフレームワーク
US7284157B1 (en) Faulty driver protection comparing list of driver faults
US8886995B1 (en) Fault tolerant state machine for configuring software in a digital computer
US20030226059A1 (en) Systems and methods for remote tracking of reboot status
US7770057B1 (en) System and method for customized disaster recovery reports
US20040117414A1 (en) Method and system for automatically updating operating systems
US20180060415A1 (en) Language tag management on international data storage
US20050081079A1 (en) System and method for reducing trouble tickets and machine returns associated with computer failures
US8843623B2 (en) Methods, apparatuses, and computer program products for automated remote data collection
WO2007139963A2 (en) Computer hardware and software diagnostic and report system
JP2010086181A (ja) 仮想計算機システム及びその管理方法、プログラム並びに記録媒体
US8311979B2 (en) Method and system for importing an application and server map to a business systems manager display
KR20040047209A (ko) 네트워크 상의 컴퓨터 시스템의 자동 복구 방법 및 이를구현하기 위한 컴퓨터 시스템의 자동 복구 시스템
US20050204199A1 (en) Automatic crash recovery in computer operating systems
US20040083357A1 (en) Method, system, and program for executing a boot routine on a computer system
US20040025077A1 (en) Method and apparatus for the dynamic tuning of recovery actions in a server by modifying hints and symptom entries from a remote location
US20110264953A1 (en) Self-Healing Failover Using a Repository and Dependency Management System
KR100358278B1 (ko) 시스템 장애 자가 진단/복구기능을 갖는 컴퓨터 시스템 및그 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: LIAN XIANG(SINGAPORE)PRIVATE LTD.

Free format text: FORMER OWNER: INTERNATIONAL BUSINESS MACHINE CORP.

Effective date: 20061117

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20061117

Address after: Singapore Changi

Applicant after: Lenovo (Singapore) Pte. Ltd.

Address before: New York, USA

Applicant before: International Business Machines Corp.

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication