CN102426415A - 冗余管理器 - Google Patents

冗余管理器 Download PDF

Info

Publication number
CN102426415A
CN102426415A CN2011103358503A CN201110335850A CN102426415A CN 102426415 A CN102426415 A CN 102426415A CN 2011103358503 A CN2011103358503 A CN 2011103358503A CN 201110335850 A CN201110335850 A CN 201110335850A CN 102426415 A CN102426415 A CN 102426415A
Authority
CN
China
Prior art keywords
application station
redundancy
application
station
present
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103358503A
Other languages
English (en)
Other versions
CN102426415B (zh
Inventor
马克.J.尼克松
肯.比奥特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fisher Rosemount Systems Inc
Original Assignee
Fisher Rosemount Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fisher Rosemount Systems Inc filed Critical Fisher Rosemount Systems Inc
Publication of CN102426415A publication Critical patent/CN102426415A/zh
Application granted granted Critical
Publication of CN102426415B publication Critical patent/CN102426415B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2025Failover techniques using centralised failover control functionality
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B9/00Safety arrangements
    • G05B9/02Safety arrangements electric
    • G05B9/03Safety arrangements electric with multiple-channel loop, i.e. redundant control systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1675Temporal synchronisation or re-synchronisation of redundant processing components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2033Failover techniques switching over of hardware resources

Abstract

一种用于应用站的冗余管理器,包括:心跳管理器;应用编程接口;以及以通信方式连接心跳管理器和应用编程接口的资源监控器。

Description

冗余管理器
本发明是以下专利申请的分案申请:申请号:200410032613.X,申请日:2004年1月2日,发明名称:用于过程控制系统的冗余应用站
技术领域
本发明涉及过程控制系统,特别涉及过程控制系统中使用的冗余应用站。
背景技术
诸如在化学、石油或其它过程中使用的过程控制系统,通常包括一个或多个集中过程控制器,它们通过模拟、数字或组合模拟/数字总线以通信方式连接到至少一个主机或操作员工作站以及一个或多个现场装置(field device)。现场装置可以是例如阀门、阀门位置控制器,开关和变送器(例如温度、压力和流速传感器),它们执行诸如打开或关闭阀门以及测量过程参数的功能。过程控制器接收表示由现场装置进行的过程测量的信号和/或关于现场装置的其它信息,使用该信息来执行控制例程并产生控制信号,这些控制信号经由总线或其它通信线路被发送到现场装置以控制过程的操作。来自现场装置和控制器的信息对操作员工作站执行的一个或多个应用可用,以使操作员能够执行有关过程的期望功能,例如浏览当前的过程状态,修改过程的操作等。
许多过程控制系统也包括一个或多个应用站。典型地,使用以通信方式经由局域网(LAN)连接到控制器、操作员工作站和过程控制系统内其它系统的个人计算机、工作站等来实现这些应用站。每个应用站可以运行一个或多个软件应用程序,它们执行过程控制系统内的运行周期(campaign)管理功能、维护管理功能、虚拟控制功能、诊断功能、实时监控功能等。
由于诸如应用站内和/或过程控制系统内其它位置的软件故障或硬件故障(例如网络通信损耗、电源损耗等)产生的应用站故障通常导致失效或故障应用站的功能和应用终止。一些过程控制系统或应用站配置为提供有限的应用站恢复功能。例如,一些公知的应用站存储了与它执行的功能和/或应用相关的配置信息、控制参数和数值、历史数据等。通过由过程控制系统对应用站进行重新开始(例如重新启动),就可以使用存储的历史信息或数据,来恢复由于硬件和/或软件错误或故障而被终止、锁定或不起作用的应用程序。
令人遗憾的是,公知应用站的恢复技术实质上是在由应用站执行的耗时的数据恢复处理和软件应用程序非同步重新例化(re-instantiation)之后进行的应用站的冷重启动或重新启动。尽管这些公知应用站恢复技术可能适合某些过程控制应用,它们并不适合所有的过程控制应用,在一些情况下,可能导致危险和/或代价高昂的后果。特别是,公知应用站恢复技术不是无缝或“无波动(bumpless)”的,因为它们在应用站的故障及其恢复之间通常陷入相当长的延时。因此,由于在相对太长的恢复期间内发生的设备或其它过程条件的改变,在故障之前存储的历史参数值可能已不再适合。在一些情况下,使用这种历史参数值是代价非常高昂的和/或危险的。例如,在虚拟控制和运行周期管理应用的情况下,使用不适当的参数值可能导致成批数据的丢失、人员和/或设备的损伤等。而且,在应用站故障是不可恢复的硬件故障的情况下,这些应用将被终止直到硬件被替换或修理,这可能需要不可接受的长期时间。
发明内容
根据本发明一个方面,一种用于应用站的冗余管理器,包括:心跳管理器;应用编程接口;以及以通信方式连接心跳管理器和应用编程接口的资源监控器。
根据本发明一个方面,一种在过程控制系统中使用的应用站包括:冗余管理器和连接到冗余管理器并适配为经由冗余通信链路与第二应用站进行通信的冗余链接子系统。冗余管理器可以建立第二应用站的冗余上下文,并可以使用冗余上下文来跟踪第二应用站的操作。此外,冗余管理器可以适配为经由冗余链路和冗余链接子系统接收来自第二应用站的信息,并响应该信息来将第二应用站的操作切换到应用站的操作。
根据本发明的另一方面,应用站中使用的冗余管理器包括心跳(heartbeat)管理器、应用编程接口和以通信方式连接到心跳管理器和应用编程接口的资源监控器。该心跳管理器可以监控从应用站接收到的操作状态信息。
根据本发明的另一方面,一种用于在具有第一和第二应用站的过程控制系统内建立冗余上下文的系统和方法,将与第一应用站相关的配置下载到第二应用站,确定第一应用站提供了足够的服务质量,并将关于第一应用站使用的一组资源的信息发送到第二应用站。此外,该系统和方法可以确定第二应用站具有存取第一应用站使用的这组资源的入口,并且可以响应确定出第二应用站具有存取第一应用站所使用的这组资源的入口,而在过程控制系统内建立冗余上下文。
附图说明
图1是使用本文描述的冗余应用站设备和方法的示例过程控制系统的方框图。
图2是可以实现图1所示的冗余应用站的示例方式的更详细的方框图。
图3是可以实现图2所示的冗余管理器的示例方式的更详细的方框图。
具体实施方式
图1是使用本文描述的冗余应用站设备和方法的示例过程控制系统10的方框图。如图1所示,过程控制系统10包括控制器12、操作员工作站14、现用应用站16和备用应用站18,所有这些设备都可以以通信方式经由总线或局域网(LAN)20连接,这通常被称为应用控制网(ACN)。可以使用一个或多个工作站或其它合适的计算机系统或处理单元来实现操作员工作站14和应用站16和18。例如,应用站16和18可以使用单处理器个人计算机、单或多处理器工作站等来实现。此外,局域网LAN 20可以使用任何希望的通信媒介和协议来实现。例如,局域网20可以基于硬连线(hardwired)或无线以太网通信方案,这些都是公知内容因此在此不作更多描述。然而,本领域的普通技术人员能够容易理解,任何其它合适的通信媒介和协议都可以被使用。而且,尽管所显示的是单个LAN,可以使用多个LAN和应用站16和18内合适的通信硬件来提供应用站16和18之间的冗余通信路径。
控制器12可以经由数字数据总线28和输入/输出(I/O)装置30连接到多个智能现场装置22、24和26。智能现场装置22-26可以是适应Fieldbus(场总线)的阀门、转动装置、传感器等,在这种情况下,智能现场装置22-26使用公知的Fieldbus协议进行通信。当然,也可以使用其它类型的智能现场装置和通信协议来代替。例如,智能现场装置22-26可以替换为使用公知Profibus和HART通信协议经由数据总线28进行通信的适应Profibus和HART的装置。附加的I/O装置(类似或等同于I/O装置30)可以连接到控制器12来使附加的智能场装置组能与控制器12通信,这些附加的智能场装置组可以是Fieldbus装置、HART装置等。
除了智能现场装置22-26外,一个或多个非智能场装置32和34可以以通信方式连接到控制器12。这些非智能场装置32和34可以是例如经由相应的硬连线链路36和38与控制器12进行通信的传统4-20毫安培(mA)或0-10伏特直流(VDC)装置。
控制器12可以是例如由Fisher-Rosemount Systems公司出售的DeltaVTM控制器。然而,可以使用任何其它控制器来代替。此外,尽管图1中只示出了一个控制器,可以将任何希望类型或类型组合的附加控制器连接到LAN20。在任何情况下,控制器12可以执行与过程控制系统10有关的一个或多个过程控制例程,它们是由使用操作员站14的系统工程师或其它系统工作员生成并被下载,并且在控制器12中例化。
如图1所示,过程控制器19也可以包括以通信方式经由通信链路42和LAN 44连接到应用站16和18的远程操作员站40。该远程操作员站40可以地理上远离设置,在这种情况下,通信链路42最好,但也并非必需,是无线通信链路、基于因特网或其它基于分组交换的通信网络、电话线(例如数字用户线)或它们的任意组合。
如图1中的示例所描绘,现用应用站16和备用应用站18以通信方式经由LAN 20和冗余链路46连接。冗余链路46可以是在现用应用站16和备用应用站18之间单独的、专用(即不共享)的通信链路。冗余链路46可以使用例如专用以太网链路(例如在相互连接的每个应用站16和18中的专用以太网卡)来实现。然而,在其它示例中,冗余链路46可以,但非必需,使用以通信方式连接到应用站16和18的LAN 20或冗余LAN(未示出)来实现。
一般而言,应用站16和18连续或周期性的经由冗余链路46交换信息(例如响应参数值改变、应用站配置改变等),以建立和维护冗余上下文。冗余上下文使得能够在现用应用站16和备用应用站18之间进行无缝或无波动的控制移交或切换。例如,冗余上下文使得能够响应现用应用站16内的硬件或软件故障或响应于系统用户或系统操作员或过程控制系统10的客户应用程序中的指示,实现从现用应用站16到备用应用站18的控制移交或切换。
在任何情况下,应用站16和18可以表现为LAN 20上作为冗余对的单个节点。特别地,备用应用站18的起“热”备用应用站的作用,在现用应用站16故障或接收来自用户的切换指示的情况下,快速和无缝地采用和继续对应用程序或现用应用站16所执行的功能的控制,而不需要耗时的例化或其它用户干预。为了实现这种“热”备用方案,当前现用应用站(例如现用应用站16)使用冗余上下文将诸如为配置信息,控制参数信息等信息经由冗余链路46通信给其冗余伙伴应用站(例如备用应用站18)。以这种方式,只要备用应用站18就绪并能够承担控制,就能够实现从当前现用应用站(例如现用应用站16)到其冗余伙伴或备用应用站(例如备用应用站18)的无缝或无波动控制转移或切换。
为了确保备用应用站18就绪并能够承担当前由现用应用站16执行的应用控制、虚拟控制功能、通信功能等,冗余上下文确定备用应用站18是否具有存取物理资源(例如LAN 20、其它外部数据资源等)的入口,是否具有要求的编程信息(例如配置和连接信息),以及要求的服务质量(例如处理器速度,存储器需求等)是否可用。此外,将维护冗余上下文以确保备用应用站18始终准备好承担控制。这种冗余上下文维护是通过在冗余应用站16和18之间传送保持操作同步所需的状态信息、配置信息或任何其它信息来实现。
在一些示例中,应用站16和18可以配置为在现用应用站16出现故障并随后恢复为健康状态或被修理或替换(并合适地配置)的情况下,现用应用站16从备用应用站18收回控制,而备用应用站18将其状态恢复为热备用站。然而,如果需要,可以将备用应用站18配置为在没有系统用户同意或一些其它类型的用户干预下,避免恢复应用站收回控制。
现用应用站16通常负责进行(即执行)虚拟控制功能、运行周期管理应用、维护管理应用、诊断应用和/或任何其它希望的功能或应用,这些功能或应用可能与过程控制系统10内所需的过程控制活动、企业优化活动等的管理和/或监控有关。备用应用站18以与现用应用站16相同的方式配置,因此包括了需要在现用应用站16内执行的每个功能和应用的备份。此外,备用应用站18包括硬件和/或存取与现用应用站16可用的资源相同或至少功能上相当的资源的入口。而且,备用应用站18经由冗余链路46跟踪现用应用站16的操作(例如,现用应用站16内执行的应用程序所使用的当前参数值)。
图2是可以实现图1所示冗余应用站的示例方式的更详细的方框图。如图2的示例所示,现用应用站16包括以通信方式连接到一个或多个冗余应用52、虚拟控制模块54、通信子系统56、操作系统58和冗余链接子系统60的冗余管理器50。类似地,备用应用站18包括冗余管理器62,一个或多个冗余应用64,虚拟控制模块66,通信子系统68,操作系统70和冗余链接子系统72。尽管备用应用站18中所示的功能模块62-72提供与现用应用站16中相应的功能模块62-72的功能相同或至少实质上相同的功能,但是对各个功能模块(例如模块50和62)使用不同的标号,以便阐明应用站16和18的操作描述。具体说来,尽管现用应用站16和备用应用站18中的对应功能模块可以提供相同(或实质上相同)的功能,但是它们在各自的应用站16和18内被独立的例化(instantiate),因此,不需要在相同的时刻具备完全相同的操作状态。
通常,功能模块50-60和62-72以协作的方式与其对应的冗余管理器50和62相互作用,以建立和维护冗余上下文。冗余上下文使备用应用站18能够跟踪或尾随现用应用站16的操作。更具体地,应用站16和18经由它们相应的冗余链接子系统60和72和冗余链路46交换信息,以使每个应用站16和18能够确定其它应用站的操作健康(即操作状态)。此外,可以经由冗余链路46在现用应用站16和备用应用站18之间传送操作参数值和其它信息。按照维护与现用应用站16实质上同步和/或尾随现用应用站16的备用应用站18内的操作条件的需要,备用应用站18的冗余管理器62可以将从现用应用站16中接收的参数信息或数值传送到一个或多个冗余应用64、虚拟控制模块66、通信子系统68和/或操作系统70等。
为了更好地理解在冗余管理器50和62及其各自的本地子系统或功能模块52-60和64-70之间的交互作用或协作,接下来将更详细地描述功能模块52-60和64-70的操作。冗余应用52和64包括一个或多个软件应用,如运行周期管理应用,维护管理应用,实时监控应用,诊断应用等。冗余应用52和64典型地但非必需为分层软件应用(即在其它软件应用上成层的软件应用)。例如,运行周期管理应用通常在一个或多个成批管理应用上成层。
冗余应用52和64向它们各自的冗余管理器50和62注册,因此它们完全集成在由冗余管理器50和62建立和维护的冗余上下文内。换句话说,冗余应用52和64可以作为冗余应用对,以便如果例如一个冗余应用52发生故障,随着从现用应用站16到备用应用站18的切换,冗余应用64内对应相同的伙伴应用能够在故障应用停止处继续执行操作。
为了使冗余应用52和64能够参与冗余上下文,应用52和64中对应的一个交换有关现用应用站16、备用应用站18的当前状态以及应用52和64的当前状态。在启动切换的情况下(例如备用应用站18响应现用应用站16的故障或响应来自系统用户的指示来承担对现用应用站16的控制),冗余管理器62可以通知冗余应用64正在进行这种切换。从而,备用应用站18可以产生一个或多个系统报警或事件,它们可以例如经由操作员站14和40中的一个或两个通知和提供给系统用户。而且,例如在现用应用站16检测到备用应用站18发生故障的情况下,冗余应用52将接收到这种情况的通知,如果需要,可以由现用应用站16产生一个或多个适当的报警或事件,并传播给操作员站14和40和/或连接到过程控制系统10的其它系统。在任何情况下,冗余应用52和64内的每个应用都被配置为以对这个应用合适的方式来响应正在进行切换的通知、备用应用站18发生故障的通知等。
虚拟控制模块54和66将需要执行虚拟控制功能的物理资源信息提供给它们各自的冗余管理器50和62,这些信息有如存储器数量、处理器速度、输入/输出信息等。例如,冗余管理器62可以使用物理资源信息来确定备用应用站18在需要进行切换的情况下是否具有接管或承担对现用应用站16的控制的能力(即应用物理资源)。此外,虚拟控制模块54和66向它们各自的冗余管理器50和62提供指示:它们使用的诸如操作数据、调整数据等信息需要在各自的应用站16和18内进行更新。以这种方式,就可以使功能模块执行、排序和成批操作等完全同步。在虚拟控制模块54和66使系统用户、操作员、第三方等能够产生自定义功能模块的情况下,这些自定义功能模块将同样由冗余管理器50和62来同步。因此,虚拟控制模块66可以跟踪(即完全同步)虚拟控制模块54的操作,以使在从现用应用站16到备用应用站18切换的情况下,虚拟控制模块66能够以无缝或无波动的方式承担(即接管)虚拟控制模块54的虚拟控制任务。优选地,虚拟控制模块66采用与在切换点处虚拟控制模块54内的对应参数值相同的参数值开始执行其模块和方法等。
而且,可以将虚拟控制模块54和66配置为提供虚拟控制模块54和66中的一个或两个内存在应该禁止或避免切换的情况的指示。例如,在现用应用站16的配置发生改变而备用应用站18没有更新的情况下,在备用应用站18内的应用(例如一个冗余应用64)发生故障的情况下,可以提供指示。
通信子系统56和68使它们各自的应用站16和18和其中的每个功能模块能够经由LAN 20相互通信,也能与过程控制系统10内的其它系统进行通信。此外,为了允许和便于应用站16和18在由冗余管理器50和62建立和维护的冗余上下文内的协作,通信子系统56和68将服务和/或信息提供给它们相应的冗余管理器50和62。具体说来,通信子系统56和68可以提供多种服务,例如允许通信子系统56和68被禁止的服务、验证现用应用站16连接到与备用应用站18相同LAN(即LAN 20)的服务、提供通信子系统发生故障的指示的服务、和一旦切换便使新的现用应用站(例如备用应用站18)能够承担当前非现用应用站(例如现用应用站16)在LAN 20上的通信任务的服务。例如,新的现用应用站可以经由LAN 20重新建立先前的现用应用站与其它系统和装置的通信连接。
每个通信子系统56和68还可以提供正在管理的数据(即连接信息、路由信息等)发生改变,因而必须在冗余合伙应用站中进行更新的指示。例如,现用应用站16的通信子系统56可以向备用应用站18指示已经建立了到现用应用站16的新连接。这个新连接信息可以由冗余管理器50经由冗余链接子系统60、冗余链路46和冗余链接子系统72而传送到冗余管理器62。接着冗余管理器62可以与通信子系统68进行通信,以建立新的连接来维护冗余上下文。以这种方式,冗余管理器62将备用应用站18维持在发生切换的情况下能够承担现用应用站16的通信任务的条件下。
冗余链接子系统60和72中的每一个提供使应用站16和18中与其相应的一个能够经由冗余链路46建立通信信道或链路的服务。此外,在应用站16和18之间的通信信道或链路发生故障的情况下,冗余链接子系统60和72将指示提供给它们相应的冗余管理器50和62。而且,冗余链接子系统60和72提供使与冗余应用52和64、虚拟控制模块54和66、通信子系统56和68、操作系统58和70等相关的操作数据能在应用站16和18之间交换的服务。
如在下文中更详细的描述,冗余管理器50和62使用其冗余链接子系统60和72以及冗余链路46的信息传送性能来传输有关监控资源的状态信息。这种状态信息可以响应参数值和/或配置的改变等,由例如现用应用站16传输给备用应用站18,以提供指示现用应用站16的健康和/或操作状态的“心跳”信号或信息。结果,如果心跳信号指示出现用应用站16的健康严重损害和/或如果心跳信号完全丢失,则备用应用站18可以启动切换,并承担对发生故障或失效现用应用站16的控制任务。
操作系统58和70可以是任何希望的操作系统,如
Figure BDA0000103778080000081
等,其中可以接纳应用站16和18的运行时环境。对于在图1所示的过程控制系统10,运行时环境可以是DeltaVTM的运行时环境。操作系统58和70可以将诸如关于与应用站16和18相关的硬件平台的状态、健康、性能等信息提供给冗余管理器50和62。当然,这种信息可以根据用于实现应用站16和18的硬件来改变。例如,在使用多处理器工作站来实现应用站16和18的情况下,或相反,在使用单处理器个人计算机来实现应用站16和18的情况下,可以提供其它类型或数量的信息。
冗余管理器50和62以协作方式与它们各自的冗余应用52和64、虚拟控制模块54和66、通信子系统56和68、操作系统58和70、以及冗余链接子系统60和72进行通信,以建立和维护冗余上下文。此外,冗余管理器50和62要么自动依据当前现用应用站的故障,要么响应来自用户的指示,管理在应用站16和18之间的切换。而且,冗余管理器50和62维护关于冗余上下文的诊断信息。例如,可以通过例如优化应用和/或诊断应用,维护并且在需要时存取和利用状态信息、数据等待时间信息等,这些优化应用和/或诊断应用在冗余应用52和64中,或者可以以下面结合图3中更详细地描述的方式与冗余管理器52和60进行通信的客户应用。
图3是可以实现图2所示冗余管理器50和62的示例方式的更详细的方框图。为清楚起见,采用备用应用站18的冗余管理器62作为图3所示的示例进行描述。然而,图3的详细方框图和下面的描述同样可以应用到现用应用站16的冗余管理器50。在任何情况下,如图3所示,冗余管理器包括心跳管理器100、资源监控器102、冗余管理器应用编程接口(API)104和冗余客户服务106。
冗余管理器API 104使一个或多个冗余应用或客户108能够参与到冗余上下文中,这些冗余应用或客户108可以包括图2所示的冗余应用64和其它应用或客户(未在图2中示出)。换句话说,冗余管理器API 104包含使一个或多个应用或客户108能连到(即与其通信)冗余管理器62,以接收状态事件或信息的改变(例如,给定应用站的切换状态、参数值或配置变化等)的功能。状态信息或由冗余管理器62传送到冗余应用/客户108的信息的变化可以依据从或基于由心跳管理器100从冗余链接子系统72接收到的信息、和/或由资源监控器102从一个或多个资源如通信子系统68和操作系统70接收到的信息得出。
冗余管理器API 104实现应用注册功能,其使冗余应用/客户108内的应用或客户能够与冗余管理器62进行通信。应用注册功能可以对每一个注册应用产生唯一的标识符,以便在需要时使冗余管理器62能够将应用定位在备用应用站18内。此外,应用注册功能可以包括回叫功能(可以使用助手线程来实现),它使冗余管理器62能够将冗余事件(例如切换、配置改变等)传送到已注册应用。
冗余管理器API 104也实现应用注销功能,该应用注销功能从注册应用列表中移除所选择的应用。应用注销功能与冗余管理器62的故障应用可区分,因此它使各种应用能被移除或注销而不需调用不必要的切换。例如,在注销在现用应用站16中注册的应用的情况下,与发生故障相反,在备用应用站18的心跳管理器100识别出有意地注销该应用并不再可用时,备用应用站18将不会自动调用切换。
在由冗余应用/客户108内的应用或客户调用的情况下,冗余管理器API104也提供强制切换功能,使现用应用站16切换到备用应用站18。而且,冗余管理器API 104提供返回冗余管理器62的当前冗余角色的功能,从而返回其中驻留冗余管理器62的应用站(图3中的示例是备用应用站18)的冗余角色。因此,当一个或多个冗余应用/客户108使用冗余角色功能查询时,冗余管理器API 104返回指示冗余管理器62和应用站18正以备用角色工作的信息。如果现用应用站16内对冗余管理器API进行类似查询,冗余管理器API将返回指示现用角色的信息。当然,可以由冗余管理器API 104提供其它任何预期功能。
在操作中,冗余管理器50和62在允许执行切换之前建立冗余上下文。开始,应用站16和18以相同(或至少实质上相同)的方式配置。优选但非必需地,将现用应用站16的配置经由LAN 20下载到例如备用应用站18中。可以在备用应用站18内设置或配置标记或其它标识符,以标明该站具有备用角色。在现用应用站16的配置已经下载到备用应用站18之后,备用应用站18经由冗余链路46启动与现用应用站16的通信。
备用应用站18经由冗余链路46与现用应用站16进行通信,以将有关建立冗余上下文所需的服务质量的信息提供给现用应用站16。例如,服务质量信息可以包括最大可允许数据等待时间参数、最大可允许失控时间、或任何其它可以影响与过程控制系统10相关的性能、安全性、成本等的参数或数值。如果现用应用站16不能提供所需的服务质量,就不能建立冗余上下文。
备用应用站18也可以查询现用应用站16,以确定现用应用站16是否已经参与了与其它应用站的冗余上下文。如果现用应用站16已经担任应用站冗余对的成员,那么将不会建立冗余上下文。
如果现用应用站16已经不作为另一个应用站的冗余伙伴来参与(即已经是其它冗余上下文的一部分),并且能够提供支持建立冗余上下文所需的服务质量,则现用应用站16发送有关采用什么资源来执行现用应用站16的操作的信息。例如,在备用应用站18和现用应用站16之间交换的资源信息包括执行现用应用站16的任务所需要的存储器需求和处理单元等级、现用应用站16支持的代理信息(即客户和服务器)、通信子系统信息(例如插口信息、因特网协议路由信息等)。
在接收资源信息后,备用应用站18确定其是否具有存取所需的资源的入口,如果没有存取所需的资源的入口,备用应用站18给现用应用站16返回合适的错误指示,并且不建立冗余上下文。另一方面,如果备用应用站18具有存取所需的资源的入口,备用应用站18就建立与现用应用站16、通信子系统68和其它任何子系统或装置的通信,以获取来自执行现用应用站18的任务所需要的资源中的信息。只要备用应用站18建立了获取所要求的资源信息所需要的通信,可以设置标记或其它标识符来指示建立了冗余上下文。
只要在现用应用站16和备用应用站18之间建立了冗余上下文,就通过将与现用应用站16相关的任何配置变化、操作参数变化、通信子系统变化、操作员变化、排序信息、成批阶段(batch phase)信息、报警通知、事件信息、资源锁定信息(例如获取装置的共享部分,如标题或反应器(reactor))通知给备用应用站18来维护上下文。例如,如果系统用户或操作员改变了现用应用站16的配置,这些变化将经由冗余链接子系统60和72以及冗余链路46由冗余管理器50通知给冗余管理器62。接着冗余管理器62更新备用应用站18的配置,以与现用应用站16的配置相匹配。类似地,如果与虚拟控制模块54等相关的诸如调整数据、控制回路参数的参数值以影响备用应用站18承担现用应用站16的控制任务的能力的方式发生改变,那么这些参数值要被通知给备用应用站18,并在备用应用站18内更新。因此,现用应用站16内的操作变化要被传送到备用应用站,以使备用应用站18与现用应用站16的操作充分同步。
在现用应用站16的配置发生改变,并将该变化传送给备用应用站18时,冗余管理器50和62就禁止自动切换(即由于现用应用站16内的故障而引起的切换)。尽管禁止了自动切换,改变的配置信息经由冗余链接子系统60和72以及冗余链路46而传送给备用应用站18。如果在备用应用站18内成功地传送和更新了配置信息,就允许自动切换。另一方面,如果配置信息的传送和/或更新失败,就解除或终止冗余上下文,在这种情况下应用站16和18不再作为冗余对。
如上所述,可以在系统用户或操作员的指引下手动地,或响应备用应用站18承担现用应用站16的任务所需要的条件或其它事件自动地,来启动切换。可以通过向冗余管理器API发送合适的功能呼叫来调用手动切换,冗余管理器API在现用应用站16的冗余管理器50内,并与冗余管理器API 104相似或相同。
响应心跳管理器100做出的现用应用站16不再经由冗余链路46发送“心跳”(即表示现用应用站16操作正常的有关监控资源的状态信息)的判定,备用应用站18启动自动切换。因此,在与冗余上下文伙伴(例如备用应用站18是现用应用站16的冗余上下文伙伴)的通信失败的情况下,冗余链接子系统60和72就配置为通知它们相应的冗余管理器50和62。此外,在LAN与应用站16和18中其对应的一个的通信失败的情况下,通信子系统56和68就配置为通知其对应的冗余管理器50和62。例如,如果现用应用站16遭受了LAN 20上的通信故障,则通信子系统56将故障通知给冗余管理器50。然后冗余管理器50使用其冗余链接子系统60将通信故障通知给备用应用站18内的冗余管理器62。
如上所述,可以响应用户的指示来调用切换。具体说来,系统用户或操作员可以经由冗余管理器API 104与一个或多个冗余应用/客户108(图3)相互作用,以呼叫调用切换的功能。优选但非必需地,将切换请求发送到现用应用站16内的冗余管理器50。当冗余管理器50接收切换请求时,冗余管理器50通知虚拟控制模块54进行切换,并且禁止任何支持现用应用站16的代理。此外,向支持现用应用站16的资源告知已经启动切换。例如,通信子系统56被告知已经请求了切换。响应切换通知,通信子系统56确保现用应用站16没有防碍成为现用(即承担控制)的备用应用站18。此外,通信子系统56也确保所有的应用站消息(例如,操作变化请求、调整请求等)都被发送给现用应用站16。
在通知了切换的资源后,冗余管理器50经由冗余链接子系统60和72以及冗余链路46进行通信,以将切换命令或请求发送给备用应用站18中的冗余管理器62。备用应用站18通过通知虚拟控制模块66进行切换并且允许所有支持虚拟控制模块66所需要的(先前在现用应用站16中被禁止的)代理,来响应该命令或请求实现切换。然后向支持虚拟控制模块66的资源通知该切换。例如,通信子系统68被告知正在进行的切换,并且作为响应,可以强制更新因特网协议路由信息,可以强制重建TCP的连接等。当然,切换也可以替代为响应现用应用站16的故障而自动启动。
冗余应用站16和18可被用于执行现用应用16的在线或“热”配置改变。例如,在建立现用应用站16和备用应用站18之间的冗余上下文后,就可以执行将现用应用站16的操作切换到备用应用站18的切换操作。然后临时禁止切换操作或功能,可以以任何希望的方式来改变现用应用站16的配置。配置变化可以包括对一个或多个冗余应用52的更新或改变、对虚拟控制模块54的改变、或任何其它希望的改变。然后再次允许切换操作或功能,并执行将现用应用站16的操作切换到备用应用站18的切换操作。
在应用站16和18的示例中示出的功能模块可以使用希望的软件、固件和硬件的任何组合来实现。例如,一个或多个微处理器、微控制器、专用集成电路(ASIC)等可以存取机器或处理器可存取的存储介质中存储的指令或数据,以实现这里描述的方法和设备。存储介质可以包括任何装置和/或介质的组合,例如包括随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)等的固态存储介质、光存储介质、磁存储介质等。此外,用于实现功能模块的软件可以附加地或可替换地经由因特网、电话线、卫星通信等传送给处理器或执行该软件的其它装置,并且可以由处理器或执行该软件的其它装置来存取。
因此,尽管本发明公开文本提供了特定的示例,但它们仅仅是起说明的作用,而并不限制本发明,本领域的普通技术人员应该明白,在不脱离本发明的精神和范围的情况下,可以对公开的实施例进行改变、增加或删除。

Claims (5)

1.一种用于应用站的冗余管理器,包括:
心跳管理器;
应用编程接口;以及
以通信方式连接心跳管理器和应用编程接口的资源监控器。
2.如权利要求1所述的冗余管理器,其中心跳管理器监控从应用站接收到的信息,其中该信息与应用站的操作状态相关。
3.如权利要求1所述的冗余管理器,其中应用编程接口包括应用注册功能、应用注销功能以及定向切换功能的其中之一。
4.如权利要求1所述的冗余管理器,其中应用编程接口被适配为使多个客户与冗余管理器对接。
5.如权利要求1所述的冗余管理器,其中资源监控器以通信方式连接到多个应用站资源。
CN201110335850.3A 2003-01-02 2004-01-02 冗余管理器 Expired - Lifetime CN102426415B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/335,289 2003-01-02
US10/335,289 US20040153700A1 (en) 2003-01-02 2003-01-02 Redundant application stations for process control systems
CN200410032613.XA CN1527169B (zh) 2003-01-02 2004-01-02 用于过程控制系统的冗余应用站

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200410032613.XA Division CN1527169B (zh) 2003-01-02 2004-01-02 用于过程控制系统的冗余应用站

Publications (2)

Publication Number Publication Date
CN102426415A true CN102426415A (zh) 2012-04-25
CN102426415B CN102426415B (zh) 2016-03-16

Family

ID=31715532

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200410032613.XA Expired - Lifetime CN1527169B (zh) 2003-01-02 2004-01-02 用于过程控制系统的冗余应用站
CN201110335850.3A Expired - Lifetime CN102426415B (zh) 2003-01-02 2004-01-02 冗余管理器

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN200410032613.XA Expired - Lifetime CN1527169B (zh) 2003-01-02 2004-01-02 用于过程控制系统的冗余应用站

Country Status (6)

Country Link
US (1) US20040153700A1 (zh)
JP (4) JP2004227566A (zh)
CN (2) CN1527169B (zh)
DE (1) DE102004001031B4 (zh)
GB (1) GB2397661B (zh)
HK (3) HK1067721A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112468212A (zh) * 2020-11-04 2021-03-09 北京遥测技术研究所 一种全天候无人值守测控站的高可用伺服系统
CN113168289A (zh) * 2018-12-03 2021-07-23 美光科技公司 使用逐出和恢复管理存储装置中的冗余上下文

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7325154B2 (en) * 2004-05-04 2008-01-29 Sun Microsystems, Inc. Service redundancy
US20060023627A1 (en) * 2004-08-02 2006-02-02 Anil Villait Computing system redundancy and fault tolerance
EP1719056A4 (en) 2004-08-26 2009-04-08 Availigent Inc METHOD AND SYSTEM FOR PROVIDING HIGH AVAILABILITY TO COMPUTING APPLICATIONS
KR100701105B1 (ko) * 2004-12-22 2007-03-28 한국전자통신연구원 Ip 기반 네트워크에서 제어채널 구성 및 보호 방법과상태 천이 방법
JP2006285448A (ja) * 2005-03-31 2006-10-19 Oki Electric Ind Co Ltd 冗長システム
US8752049B1 (en) 2008-12-15 2014-06-10 Open Invention Network, Llc Method and computer readable medium for providing checkpointing to windows application groups
US8082468B1 (en) * 2008-12-15 2011-12-20 Open Invention Networks, Llc Method and system for providing coordinated checkpointing to a group of independent computer applications
JP4787614B2 (ja) * 2005-12-22 2011-10-05 株式会社リコー 画像形成装置及びアプリケーション管理プログラム
US8359112B2 (en) * 2006-01-13 2013-01-22 Emerson Process Management Power & Water Solutions, Inc. Method for redundant controller synchronization for bump-less failover during normal and program mismatch conditions
JP2007226400A (ja) * 2006-02-22 2007-09-06 Hitachi Ltd 計算機管理方法、計算機管理プログラム、実行サーバの構成を管理する待機サーバ及び計算機システム
US8051326B2 (en) 2006-12-29 2011-11-01 Futurewei Technologies, Inc. System and method for completeness of TCP data in TCP HA
US9648147B2 (en) * 2006-12-29 2017-05-09 Futurewei Technologies, Inc. System and method for TCP high availability
US9516580B2 (en) * 2007-03-19 2016-12-06 Texas Instruments Incorporated Enabling down link reception of system and control information from intra-frequency neighbors without gaps in the serving cell in evolved-UTRA systems
JP2009016905A (ja) * 2007-06-29 2009-01-22 Fujitsu Ltd パケットネットワークシステム
CN101226397A (zh) * 2008-02-04 2008-07-23 南京理工大学 高可靠性分布式以太网测控系统
US7971099B2 (en) * 2008-04-02 2011-06-28 International Business Machines Corporation Method for enabling faster recovery of client applications in the event of server failure
JP5074274B2 (ja) * 2008-04-16 2012-11-14 株式会社日立製作所 計算機システム及び通信経路の監視方法
US8700760B2 (en) * 2008-08-18 2014-04-15 Ge Fanuc Intelligent Platforms, Inc. Method and systems for redundant server automatic failover
DE102008045316B4 (de) 2008-09-02 2018-05-24 Trumpf Werkzeugmaschinen Gmbh + Co. Kg System und Verfahren zur Fernkommunikation zwischen einem zentralen Computer, einer Maschinensteuerung und einem Servicecomputer
US8590033B2 (en) * 2008-09-25 2013-11-19 Fisher-Rosemount Systems, Inc. One button security lockdown of a process control network
US8782670B2 (en) 2009-04-10 2014-07-15 Open Invention Network, Llc System and method for application isolation
US8281317B1 (en) 2008-12-15 2012-10-02 Open Invention Network Llc Method and computer readable medium for providing checkpointing to windows application groups
US8752048B1 (en) 2008-12-15 2014-06-10 Open Invention Network, Llc Method and system for providing checkpointing to windows application groups
US8341631B2 (en) 2009-04-10 2012-12-25 Open Invention Network Llc System and method for application isolation
US8880473B1 (en) 2008-12-15 2014-11-04 Open Invention Network, Llc Method and system for providing storage checkpointing to a group of independent computer applications
US8464256B1 (en) 2009-04-10 2013-06-11 Open Invention Network, Llc System and method for hierarchical interception with isolated environments
US8539488B1 (en) 2009-04-10 2013-09-17 Open Invention Network, Llc System and method for application isolation with live migration
US8904004B2 (en) * 2009-04-10 2014-12-02 Open Invention Network, Llc System and method for maintaining mappings between application resources inside and outside isolated environments
US9577893B1 (en) 2009-04-10 2017-02-21 Open Invention Network Llc System and method for cached streaming application isolation
US10419504B1 (en) 2009-04-10 2019-09-17 Open Invention Network Llc System and method for streaming application isolation
US8555360B1 (en) 2009-04-10 2013-10-08 Open Invention Network Llc System and method for on-line and off-line streaming application isolation
US9058599B1 (en) 2009-04-10 2015-06-16 Open Invention Network, Llc System and method for usage billing of hosted applications
US11538078B1 (en) 2009-04-10 2022-12-27 International Business Machines Corporation System and method for usage billing of hosted applications
US8418236B1 (en) 2009-04-10 2013-04-09 Open Invention Network Llc System and method for streaming application isolation
DE102010003539A1 (de) 2010-03-31 2011-10-06 Robert Bosch Gmbh Verfahren und Schaltungsanordnung zur Bestimmung von Position-Minus-Zeit
WO2012047654A1 (en) * 2010-09-27 2012-04-12 Fisher-Rosemount Systems, Inc. Methods and apparatus to virtualize a process control system
CN102193543B (zh) * 2011-03-25 2013-05-15 上海磁浮交通发展有限公司 基于现场总线冗余网络拓扑结构的控制系统及其切换方法
US9331955B2 (en) 2011-06-29 2016-05-03 Microsoft Technology Licensing, Llc Transporting operations of arbitrary size over remote direct memory access
US8788579B2 (en) * 2011-09-09 2014-07-22 Microsoft Corporation Clustered client failover
US20130067095A1 (en) 2011-09-09 2013-03-14 Microsoft Corporation Smb2 scaleout
JP5661659B2 (ja) * 2012-02-03 2015-01-28 株式会社日立製作所 プラント監視制御装置及びプラント監視制御方法
DE102012003242A1 (de) * 2012-02-20 2013-08-22 Phoenix Contact Gmbh & Co. Kg Verfahren zum ausfallsicheren Betreiben eines Prozesssteuersystems mit redundanten Steuereinrichtungen
US9483352B2 (en) * 2013-09-27 2016-11-01 Fisher-Rosemont Systems, Inc. Process control systems and methods
FR3025626B1 (fr) 2014-09-05 2017-11-03 Sagem Defense Securite Architecture bi-voies avec liaisons ccdl redondantes
US10505757B2 (en) 2014-12-12 2019-12-10 Nxp Usa, Inc. Network interface module and a method of changing network configuration parameters within a network device
US10176012B2 (en) 2014-12-12 2019-01-08 Nxp Usa, Inc. Method and apparatus for implementing deterministic response frame transmission
JP6299640B2 (ja) * 2015-03-23 2018-03-28 横河電機株式会社 通信装置
JP6265158B2 (ja) * 2015-03-27 2018-01-24 横河電機株式会社 電子機器
JP6409812B2 (ja) * 2016-04-01 2018-10-24 横河電機株式会社 冗長化装置、冗長化システム、及び冗長化方法
US10628352B2 (en) 2016-07-19 2020-04-21 Nxp Usa, Inc. Heterogeneous multi-processor device and method of enabling coherent data access within a heterogeneous multi-processor device
CN107219831B (zh) * 2017-06-13 2023-08-11 蚌埠凯盛工程技术有限公司 一种特种玻璃生产线dcs与dlp液晶大屏幕接口控制系统
CN108563150B (zh) * 2018-04-18 2020-06-16 东莞理工学院 一种末端反馈设备
CN112639640A (zh) * 2018-09-05 2021-04-09 西门子股份公司 冗余热备控制系统、控制设备、冗余热备方法及计算机可读存储介质
CN110707824B (zh) * 2019-11-12 2021-08-20 上海思源弘瑞自动化有限公司 一种测控装置的冗余配置方法、装置、设备和存储介质
US11061785B2 (en) 2019-11-25 2021-07-13 Sailpoint Technologies, Israel Ltd. System and method for on-demand warm standby disaster recovery
RU2745946C1 (ru) * 2019-12-10 2021-04-05 ООО "Технократ" Резервированная система управления на основе программируемых контроллеров
EP4148507A4 (en) * 2020-05-19 2023-06-21 Huawei Technologies Co., Ltd. CONTROL METHOD AND DEVICE
CN113495484A (zh) * 2021-06-21 2021-10-12 宝信软件(武汉)有限公司 一种工业水处理循环控制的多切换系统
CN116841185B (zh) * 2023-09-01 2023-11-21 浙江大学 一种可高实时多层次动态重构的工业控制系统架构

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4610013A (en) * 1983-11-08 1986-09-02 Avco Corporation Remote multiplexer terminal with redundant central processor units
WO1999032947A1 (en) * 1997-12-19 1999-07-01 Honeywell Inc. Systems and methods for synchronizing redundant controllers with minimal control disruption
US5978932A (en) * 1997-02-27 1999-11-02 Mitsubishi Denki Kabushiki Kaisha Standby redundancy system
CN1246183A (zh) * 1996-12-13 2000-03-01 Cbs公司 全冗余的基于工作站的分布式处理控制系统
US20010056304A1 (en) * 2000-04-19 2001-12-27 Kabushiki Kaisha Toshiba Field apparatus control system and computer-readable storage medium

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4141066A (en) * 1977-09-13 1979-02-20 Honeywell Inc. Process control system with backup process controller
JPS6140643A (ja) * 1984-07-31 1986-02-26 Hitachi Ltd システムの資源割当て制御方式
JPS6272248A (ja) * 1985-09-25 1987-04-02 Hitachi Ltd デ−タ伝送システムの現用予備切替方法
DE69027788D1 (de) * 1989-01-17 1996-08-22 Landmark Graphics Corp Verfahren zur Übertragung von Daten zwischen gleichzeitig ablaufenden Rechnerprogrammen
US4958270A (en) * 1989-01-23 1990-09-18 Honeywell Inc. Method for control data base updating of a redundant processor in a process control system
US5088021A (en) * 1989-09-07 1992-02-11 Honeywell, Inc. Apparatus and method for guaranteed data store in redundant controllers of a process control system
AU6894491A (en) * 1989-11-27 1991-06-26 Olin Corporation Method and apparatus for providing backup process control
JP2560510B2 (ja) * 1990-03-06 1996-12-04 日本電気株式会社 ネットワーク管理マネージャ切り替え方式
EP0518630A3 (en) * 1991-06-12 1993-10-20 Aeci Ltd Redundant control system
US5758052A (en) * 1991-10-02 1998-05-26 International Business Machines Corporation Network management method using redundant distributed control processors
US5551047A (en) * 1993-01-28 1996-08-27 The Regents Of The Univeristy Of California Method for distributed redundant execution of program modules
JPH06348523A (ja) * 1993-06-07 1994-12-22 Toshiba Corp 二重化監視制御システム
JPH0736720A (ja) * 1993-07-20 1995-02-07 Yokogawa Electric Corp 二重化コンピュータ装置
JPH07141216A (ja) * 1993-11-15 1995-06-02 Hitachi Ltd システム構成変更処理方式
US5537583A (en) * 1994-10-11 1996-07-16 The Boeing Company Method and apparatus for a fault tolerant clock with dynamic reconfiguration
JPH08202570A (ja) * 1995-01-24 1996-08-09 Fuji Facom Corp 二重化プロセス制御装置
US5655081A (en) * 1995-03-08 1997-08-05 Bmc Software, Inc. System for monitoring and managing computer resources and applications across a distributed computing environment using an intelligent autonomous agent architecture
US5974562A (en) * 1995-12-05 1999-10-26 Ncr Corporation Network management system extension
US6049838A (en) * 1996-07-01 2000-04-11 Sun Microsystems, Inc. Persistent distributed capabilities
US6826590B1 (en) * 1996-08-23 2004-11-30 Fieldbus Foundation Block-oriented control system on high speed ethernet
JP3913324B2 (ja) * 1997-08-15 2007-05-09 富士フイルム株式会社 画像情報記録媒体およびそれを使用するフォトフィニッシングシステム並びにそれを生成するプログラムを記録した記録媒体
JPH1165867A (ja) * 1997-08-27 1999-03-09 Hitachi Ltd 負荷分散形システムにおけるシステム二重化方法
US6148410A (en) * 1997-09-15 2000-11-14 International Business Machines Corporation Fault tolerant recoverable TCP/IP connection router
US6275953B1 (en) * 1997-09-26 2001-08-14 Emc Corporation Recovery from failure of a data processor in a network server
CA2217277A1 (en) * 1997-10-03 1999-04-03 Newbridge Networks Corporation Automatic link establishment for distributed servers in atm networks
JP3651742B2 (ja) * 1998-01-21 2005-05-25 株式会社東芝 プラント監視システム
US6477663B1 (en) 1998-04-09 2002-11-05 Compaq Computer Corporation Method and apparatus for providing process pair protection for complex applications
US6243825B1 (en) * 1998-04-17 2001-06-05 Microsoft Corporation Method and system for transparently failing over a computer name in a server cluster
US6330689B1 (en) * 1998-04-23 2001-12-11 Microsoft Corporation Server architecture with detection and recovery of failed out-of-process application
JP3248485B2 (ja) * 1998-05-29 2002-01-21 日本電気株式会社 クラスタシステム、クラスタシステムにおける監視方式およびその方法
JP3360719B2 (ja) * 1998-06-19 2002-12-24 日本電気株式会社 ディスクアレイクラスタリング通報方法およびシステム
US6266781B1 (en) * 1998-07-20 2001-07-24 Academia Sinica Method and apparatus for providing failure detection and recovery with predetermined replication style for distributed applications in a network
US6247142B1 (en) * 1998-08-21 2001-06-12 Aspect Communications Apparatus and method for providing redundancy in a transaction processing system
US6286047B1 (en) * 1998-09-10 2001-09-04 Hewlett-Packard Company Method and system for automatic discovery of network services
US6470450B1 (en) * 1998-12-23 2002-10-22 Entrust Technologies Limited Method and apparatus for controlling application access to limited access based data
JP2000222233A (ja) * 1999-01-28 2000-08-11 Nec Eng Ltd デュプレックスシステムおよび現用系・待機系切り換え方法
JP2001005684A (ja) * 1999-06-17 2001-01-12 Mitsubishi Electric Corp 制御装置およびそれを用いた制御システム
JP2001022709A (ja) * 1999-07-13 2001-01-26 Toshiba Corp クラスタシステム及びプログラムを記憶したコンピュータ読み取り可能な記憶媒体
US6397385B1 (en) * 1999-07-16 2002-05-28 Excel Switching Corporation Method and apparatus for in service software upgrade for expandable telecommunications system
US7140025B1 (en) * 1999-11-16 2006-11-21 Mci, Llc Method and apparatus for providing a real-time message routing communications manager
US6594786B1 (en) * 2000-01-31 2003-07-15 Hewlett-Packard Development Company, Lp Fault tolerant high availability meter
US6898727B1 (en) * 2000-03-22 2005-05-24 Emc Corporation Method and apparatus for providing host resources for an electronic commerce site
US6643795B1 (en) * 2000-03-30 2003-11-04 Hewlett-Packard Development Company, L.P. Controller-based bi-directional remote copy system with storage site failover capability
JP3576922B2 (ja) * 2000-04-28 2004-10-13 エヌイーシーネクサソリューションズ株式会社 アプリケーションプログラムの監視方法、及びアプリケーション・サービスを提供する方法
US20020023117A1 (en) * 2000-05-31 2002-02-21 James Bernardin Redundancy-based methods, apparatus and articles-of-manufacture for providing improved quality-of-service in an always-live distributed computing environment
US7225244B2 (en) * 2000-05-20 2007-05-29 Ciena Corporation Common command interface
DE10030329C1 (de) * 2000-06-27 2002-01-24 Siemens Ag Redundantes Steuerungssystem sowie Steuerrechner und Peripherieeinheit für ein derartiges Steuerungssystem
US7693976B2 (en) * 2000-07-11 2010-04-06 Ciena Corporation Granular management of network resources
JP2002041305A (ja) * 2000-07-26 2002-02-08 Hitachi Ltd 仮想計算機システムにおける計算機資源の割当て方法および仮想計算機システム
JP2002116920A (ja) * 2000-10-05 2002-04-19 Toshiba Corp クラスタシステム、クラスタシステムにおける監視方法およびコンピュータプログラム
EP1332578A4 (en) * 2000-10-16 2006-12-20 Goahead Software Inc TECHNIQUES FOR NETWORK SYSTEMS TO MAINTAIN HIGH AVAILABILITY
US7058629B1 (en) * 2001-02-28 2006-06-06 Oracle International Corporation System and method for detecting termination of an application instance using locks
US7263597B2 (en) * 2001-04-19 2007-08-28 Ciena Corporation Network device including dedicated resources control plane
US20030037284A1 (en) * 2001-08-15 2003-02-20 Anand Srinivasan Self-monitoring mechanism in fault-tolerant distributed dynamic network systems
US6934880B2 (en) * 2001-11-21 2005-08-23 Exanet, Inc. Functional fail-over apparatus and method of operation thereof
US7382724B1 (en) * 2001-11-21 2008-06-03 Juniper Networks, Inc. Automatic switchover mechanism in a network device
US7111084B2 (en) * 2001-12-28 2006-09-19 Hewlett-Packard Development Company, L.P. Data storage network with host transparent failover controlled by host bus adapter
US8856345B2 (en) * 2002-03-11 2014-10-07 Metso Automation Oy Redundancy in process control system
US7085956B2 (en) * 2002-04-29 2006-08-01 International Business Machines Corporation System and method for concurrent logical device swapping
US6868067B2 (en) * 2002-06-28 2005-03-15 Harris Corporation Hybrid agent-oriented object model to provide software fault tolerance between distributed processor nodes
US7197664B2 (en) * 2002-10-28 2007-03-27 Intel Corporation Stateless redundancy in a network device
US7246261B2 (en) * 2003-07-24 2007-07-17 International Business Machines Corporation Join protocol for a primary-backup group with backup resources in clustered computer system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4610013A (en) * 1983-11-08 1986-09-02 Avco Corporation Remote multiplexer terminal with redundant central processor units
CN1246183A (zh) * 1996-12-13 2000-03-01 Cbs公司 全冗余的基于工作站的分布式处理控制系统
US5978932A (en) * 1997-02-27 1999-11-02 Mitsubishi Denki Kabushiki Kaisha Standby redundancy system
WO1999032947A1 (en) * 1997-12-19 1999-07-01 Honeywell Inc. Systems and methods for synchronizing redundant controllers with minimal control disruption
US20010056304A1 (en) * 2000-04-19 2001-12-27 Kabushiki Kaisha Toshiba Field apparatus control system and computer-readable storage medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113168289A (zh) * 2018-12-03 2021-07-23 美光科技公司 使用逐出和恢复管理存储装置中的冗余上下文
CN113168289B (zh) * 2018-12-03 2022-04-19 美光科技公司 使用逐出和恢复管理存储装置中的冗余上下文
CN112468212A (zh) * 2020-11-04 2021-03-09 北京遥测技术研究所 一种全天候无人值守测控站的高可用伺服系统
CN112468212B (zh) * 2020-11-04 2022-10-04 北京遥测技术研究所 一种全天候无人值守测控站的高可用伺服系统

Also Published As

Publication number Publication date
CN1527169A (zh) 2004-09-08
JP2010044782A (ja) 2010-02-25
HK1075502A1 (en) 2005-12-16
CN1527169B (zh) 2012-04-25
JP2010044781A (ja) 2010-02-25
DE102004001031A1 (de) 2004-09-16
JP5243384B2 (ja) 2013-07-24
GB2397661A (en) 2004-07-28
JP5592931B2 (ja) 2014-09-17
GB0330204D0 (en) 2004-02-04
HK1075503A1 (en) 2005-12-16
US20040153700A1 (en) 2004-08-05
JP2004227566A (ja) 2004-08-12
HK1067721A1 (en) 2005-04-15
CN102426415B (zh) 2016-03-16
JP2013101650A (ja) 2013-05-23
DE102004001031B4 (de) 2022-11-17
GB2397661B (en) 2005-08-24

Similar Documents

Publication Publication Date Title
CN1527169B (zh) 用于过程控制系统的冗余应用站
JP4597154B2 (ja) プロセス制御システムにおける冗長装置
CN102890504B (zh) 集成到过程控制/安全系统中的在线装置检测块
JP2003099102A (ja) 設定機能性、障害分離機能性、および冗長障害援助機能性を有する入出力デバイス
CN103246213A (zh) 冗余控制装置之间的备用同步连接
CN101631040A (zh) 一种统一管理多业务系统的实时监控报警系统和方法
CN102810244A (zh) 用于告警设备去除的系统和方法
GB2623612A (en) Apparatuses and methods for non-disruptive replacement of simplex I/O components
JPWO2002045352A1 (ja) ネットワーク監視制御システム
US10394671B2 (en) Fault-tolerant, serviceable automation system
GB2410574A (en) Redundancy in a process control system
KR101545232B1 (ko) 분산형 컴퓨팅을 이용한 통합 감시 제어 시스템
CN112532454A (zh) 一种fc交换网络系统网络管理方法
CN108873823B (zh) 数据管理和传输系统
JP2002082711A (ja) 制御システム
US20140371930A1 (en) Energy distribution network
US11916806B2 (en) Monitoring a communication system that is used for control and/or surveillance of an industrial process
JP2001125627A (ja) 分散型プラント監視制御装置
CN116360302A (zh) 控制系统以及控制方法
JPH08130498A (ja) 階層化ネットワークシステムのステータス管理方 法
KR19990074462A (ko) 핫 백업을 이용한 반도체 제조설비 관리 시스템
CN101490633A (zh) 具有多个经由数据连接联网的用于汽车的诊断和/或编程装置的工厂系统
JP2001265624A (ja) 遠隔保守方法およびシステム
JPH06230996A (ja) Faコントローラの二重化装置
JPH0457263B2 (zh)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20160316

CX01 Expiry of patent term