CN1302419C - 用于具有共享存储器的多节点环境的系统和方法 - Google Patents

用于具有共享存储器的多节点环境的系统和方法 Download PDF

Info

Publication number
CN1302419C
CN1302419C CNB028230981A CN02823098A CN1302419C CN 1302419 C CN1302419 C CN 1302419C CN B028230981 A CNB028230981 A CN B028230981A CN 02823098 A CN02823098 A CN 02823098A CN 1302419 C CN1302419 C CN 1302419C
Authority
CN
China
Prior art keywords
node
operating system
server
membership qualification
section point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB028230981A
Other languages
English (en)
Other versions
CN1589447A (zh
Inventor
M·J·卡拉汉
C·卡斯珀
B·A·金斯博里
P·克吕格尔
K·F·多夫
T·M·罗科普
M·J·斯皮策尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ot Patent Trusteeship Co ltd
Original Assignee
Polyserve Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Polyserve Inc filed Critical Polyserve Inc
Publication of CN1589447A publication Critical patent/CN1589447A/zh
Application granted granted Critical
Publication of CN1302419C publication Critical patent/CN1302419C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores
    • G06F9/526Mutual exclusion algorithms
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99938Concurrency, e.g. lock management in shared database
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Abstract

公开了一种用于提供多节点环境的系统和方法,所述多节点环境包括与第一操作系统(300a)相关联的第一节点(306a);与第二操作系统相关联的第二节点,其中,所述第二操作系统独立于所述第一操作系统;存储器;以及将所述第二节点与存储器耦合的互连(304);并且,其中所述第一节点直接地访问所述存储器,并且所述第二节点直接地访问所述存储器。

Description

用于具有共享存储器的多节点环境的系统和方法
相关申请的交叉引用
本申请要求2001年9月21日提交的、标题为“SHARED STORAGELOCK:A NEW SOFTWARE SYNCHRONIZATION MECHANISM FOR ENFORCINGMUTUAL EXCLUSION AMONG MULTIPLE NEGOTIATORS”的美国临时专利申请第60/324,196号(代理人文档号第POLYP001+)的优先权,其在这里引入以供多种目的参考。
本申请要求2001年9月21日提交的、标题为“JOUNALINGMECHANISM WITH EFFICIENT,SELECTIVE RECOVERY FOR MULTI-NODEENVIRONMENTS”的美国临时专利申请第60/324,226号(代理人文档号POLYP002+)的优先权,其在这里引入以供多种目的参考。
本申请要求2001年9月21日提交的、标题为“COLLABORATIVECACHING IN A MULTI-NODE FILE SYSTEM”的美国临时专利申请第60/324,224号(代理人文档号POLYP003+)的优先权,其在这里引入以供多种目的参考。
本申请要求2001年9月21日提交的、标题为“DISTRIBUTEDMANAGEMENT OF A STORAGE AREA NETWORK”的美国临时专利申请第60/324,242号(代理人文档号POLYP005+)的优先权,其在这里引入以供多种目的参考。
本申请要求2001年9月21日提交的、标题为“METHOD FORIMPLEMENTING JOURNALING AND DISTRIBUTED LOCK MANAGEMENT”的美国临时专利申请第60/324,195号(代理人文档号POLYP006+)的优先权,其在这里引入以供多种目的参考。
本申请要求2001年9月21日提交的、标题为“MATRIX SERVER:A HIGHLY AVAILABLE MATRIX PROCESSING SYSTEM WITH COHERENTSHARED FILE STORAGE”的美国临时专利申请第60/324,243号(代理人文档号POLYP007+)的优先权,其在这里引入以供多种目的参考。
本申请要求2001年9月21日提交的、标题为“A METHOD FOREFFICIENT ON-LINE LOCK RECOVERY IN A HIGHLY AVAILABLE MATRIXPROCESSING SYSTEM”的美国临时专利申请第60/324,787号(代理人文档号POLYP008+)的优先权,其在这里引入以供多种目的参考。
本申请要求2001年10月1日提交的、标题为“FAST LOCKRECOVERY:A METHOD FOR EFFICIENT ON-LINE LOCK RECOVERY INA HIGHLY AVAILABLE MATRIX PROCESSING SYSTEM”的美国临时专利申请第60/327,191号(代理人文档号POLYP009+)的优先权,其在这里引入以供多种目的参考。
本申请涉及与此同时提交的、标题为“A SYSTEM AND METHOD FORSYNCHRONIZATION FOR ENFORCING MUTUAL EXCLUSION AMONG MULTIPLENEGOTIATORS”的美国共同未决专利申请第__号(代理人文档号POLYP001),其在这里引入以供多种目的参考;并涉及与此同时提交的、标题为“SYSTEM AND METHOD FOR JOURNAL RECOVERY FOR MULTINODEENVIRONMENTS”的美国共同未决专利申请第__号(代理人文档号POLYP002),其在这里引入以供参考;并涉及与此同时提交的、标题为“A SYSTEM AND METHOD FOR COLLABORATIVE CACHING IN A MULTINODESYSTEM”的美国共同未决专利申请第__号(代理人文档号POLYP003),其在这里引入以供多种目的参考;并涉及与此同时提交的、标题为“ASYSTEM AND METHOD FOR MANAGEMENT OF A STORAGE AREA NETWORK”的美国共同未决专利申请第__号(代理人文档号POLYP005),其在这里引入以供多种目的参考;并涉及与此同时提交的、标题为“SYSTEMAND METHOD FOR IMPLEMENTING JOURNALING IN A MULTI-NODEENVIRONMENT”的美国共同未决专利申请第__号(代理人文档号POLYP006),其在这里引入以供多种目的参考;并涉及与此同时提交的、标题为“A SYSTEM AND METHOD FOR EFFICIENT LOCK RECOVERY”的美国共同未决专利申请第__号(代理人项第POLYP009号),其在这里引入以供多种目的参考。
技术领域
本发明一般来讲涉及计算机系统。具体来讲,本发明涉及共享诸如存储器之类的资源的计算机系统。
背景技术
服务器通常被用于大的应用和工作负荷,例如和大的web服务和制造一起使用的那些。往往,单一的服务器没有足够的能力来执行所需要的应用。可以使用几个服务器和存储区域网络(SAN)中的几个存储设备一起来适应繁重的通信量。随着系统变大,应用往往变得足够重要到要避免关闭访问来执行维护。
典型的服务器管理系统使用管理服务器和共享存储器的单一管理控制站。这样一种系统的隐患是它可能具有能够令整个存储区域网络关闭来执行维护的单点故障。另一隐患是在万一发生系统改变的情况下,在这些服务器之间通常不存在动态协作。
这种系统通常使用大的大型计算机。这种大型计算机的一个问题是它们非常昂贵。另一种可能的系统可以使用较小的计算机,但是这种解决方案通常需要定制的硬件以及定制的操作系统,将这些计算机协调起来,以致它好象是一个在它们之间使用一个操作系统的大机器。获取和维护定制硬件可能是非常昂贵的。
所需要的是以低价提供一种具有共享存储器的多节点环境的系统和方法。本发明解决了这样一种需要。
附图说明
通过以下结合附图的详细说明,将容易地理解本发明,其中类似的附图标记标明类似的结构单元,并且其中:
图1是一种典型服务器系统的范例的方框图。
图2是典型服务器系统的另一范例的方框图。
图3是依据本发明的一个实施例的、用于多节点环境的系统的方框图。
图4是依据本发明的一个实施例的、系统的另一方框图。
图5是依据本发明的一个实施例的、服务器300的软件组件的方框图。
图6是依据本发明的一个实施例的、用于多节点环境的方法的流程图。
图7A-7C是依据本发明的实施例的、用于多节点环境的方法的其他流程图。
图8是依据本发明的一个实施例的、用于读取文件的方法的流程图。
图9A-9B是依据本发明的实施例的、用于写入文件的方法的流程图。
图10A-10B是依据本发明的实施例的、用于向共享存储器例如磁盘的一集群服务器添加一个节点的方法的流程图。
图11A-11C是根据本发明的、用于处理服务器故障的方法的流程图。
图12是依据本发明的一个实施例的、用于添加或者去除共享存储器的方法的流程图。
具体实施方式
应该理解的是,本发明能够以多种方式来实现,包括作为过程、设备、系统、或者诸如计算机可读存储介质或者经由光学或者电子通信链接发送程序指令的计算机网络之类的计算机可读介质。应被注意的是,所公开过程的步骤的顺序可以在本发明范围内改变。
在下面随着附图一起提供本发明的一个或多个最佳实施例的详细说明,所述附图以举例的方式图解了本发明的原理。虽然本发明是结合此类实施例说明的,但应当被理解的是:本发明不局限于任一实施例。相反地,本发明的范围仅仅由所附权利要求书限制,并且本发明涵盖多种替代方案、修改方案以及等效方案。作为例子,在下列说明中阐述了许多具体细节,用于提供对本发明的彻底的了解。本发明可以依据权利要求书来实践,而没有这些细节中的一些或者所有。为了清晰起见,在与本发明相关的在技术领域中已知的技术材料并没有被详细说明,以便本发明不被不必要的模糊。
图1是一种常规的服务器系统的方框图。在本范例中,计算机100A-100D通过网络102联网在一起。每一计算机100A-100D令它们自身与存储器104A-104D本地相连接。商业计算通常需要有规律的信息共享,但是这类系统访问共享信息可能很慢,或者它可能需要非常昂贵的定制硬件。
图2是另一常规系统的方框图。在本范例中,各服务器200A-200D跨过所有服务器200A-200D都使用单一操作系统。这类系统可能是非常昂贵的,因为它通常需要定制硬件。这类系统的另一问题是如果单一计算机200A-200D中存在故障,则很可能需要关闭整个多服务器系统。相应地,每一计算机需要比标准计算机更可靠,从而进一步增加了成本。
所需要的是一种用于多节点环境的系统和方法,其不需要定制的硬件组件。本发明解决了这样一种需要。
图3是依据本发明的一个实施例的、用于多节点环境的系统的方框图。在本范例中,服务器300A-300D是经由网络互连302耦合的。网络互连302能够代表能够进行主机-主机通信的任一网络基础架构,例如以太网、InfiniBand网络或者光纤通道网络。服务器300A-300D还与数据存储器互连304耦合,其随后与共享存储器306A-306D耦合。数据存储器互连304能够是任一能够允许通过服务器300A-300D访问共享存储器306A-306D的互连。数据存储器互连304的一个范例是光纤通道交换机,例如Brocade 3200光纤通道交换机。替换地,所述数据存储器网络也可以是iSCSI或者其他IP存储器网络、InfiniBand网络、或者其他种类的主机-存储器网络。此外,网络互连302和数据存储器互连304可以以单一的互连来具体实现。
服务器300A-300D能够是任一计算机,优选的是市售计算机或者服务器或者它们的任一等效物。服务器300A-300D均能够运行彼此独立的操作系统。相应地,每一服务器300A-300D均能够、但不是必需运行一个不同的操作系统。例如,服务器300A可以运行Microsoft Windows,同时服务器300B运行Linux,而服务器300C能够同时地运行UNIX操作系统。服务器300A-300D运行独立的操作系统的优点是整个多节点系统能够是动态的。例如,服务器300A-300D之一能够出现故障,而其他服务器300A-300D继续工作。
共享存储器306A-306D能够是任一存储装置,例如硬盘、高密度盘、磁带、和随机存取存储器。文件系统是建立在共享存储器上的逻辑实体。尽管共享存储器306A-306D通常被认为是一个物理设备,而文件系统通常被认为是在该存储器的部分上覆盖的逻辑结构,但为简单起见,所述文件系统在这里有时被称为共享存储器。例如,当据称共享存储器出现故障的时候,它可能是文件系统的一部分、一个或多个文件系统或者其上覆盖有文件系统的物理存储装置中的故障。相应地,如在这里所使用的一样,共享存储器可意谓为物理存储装置、文件系统的一部分、一个文件系统、多个文件系统或者它们的任一组合。
图4是依据本发明的一个实施例的系统的另一方框图。在本范例中,该系统优选的是没有单点故障。相应地,服务器300A′-300D′与多个网络互连302A-302D耦合。服务器300A′-300D′还被表示为与多个存储器互连304A-304B耦合。存储器互连304A-304B均与多个数据存储器306A′-306D′耦合。
用这样的方式,在系统中存在冗余,以致如果这些组件或者连接中的任何一个出现故障,则整个系统能够继续工作。
在图4中所示范例以及图3中所示范例中,服务器300A′-300D′的数目、存储器互连304A-304B的数目和数据存储器306A′-306D′的数目能够和顾客需求一样多,并且物理上不受该系统限制。同样地,由服务器300A′-300D′使用的操作系统也可以是与顾客需求同样多的独立操作系统。
图5是依据本发明的一个实施例的服务器300的软件组件的方框图。在本发明的一个实施例中,图3中的每一服务器300A-300D均包括这些软件组件。
在本实施例中,示出了以下组件:
分布式锁管理器(DLM)500管理用于文件系统图像306a-306d的矩阵宽的锁,包括在系统崩溃恢复期间的锁的状态的管理。矩阵文件系统504使用受DLM 500管理的锁,来实现矩阵宽的互斥以及矩阵宽的文件系统306a-306d元数据与数据高速缓存器的一致性。DLM 500是一种分布式对称锁管理器。优选的是,在矩阵中的每一个服务器上驻留该DLM 500的一个实例。每一实例是对于每隔一个实例的对等体(peer);在这些实例之间没有主/从关系。
锁高速缓存层(“LCL”)502是操作系统内核内部的一个组件,其在矩阵文件系统504和应用级DLM 500之间提供接口。LCL 502的目的包括以下:
1.它为需要获得分布式锁的内核驻留客户端隐藏了DLM 500的细节。
2.它对DLM 500锁进行高速缓存(也就是说,它在客户已经释放对DLM 500锁的所有引用之后,仍可以保持DLM 500锁),有时免除了内核组件与应用级进程(DLM 500)通信来获取矩阵宽的锁的必要。
3.它提供了在进程和服务器范围两者中获得锁的能力(其中,一个进程锁确保保持了相应的DLM(500)锁,并且还排斥试图在冲突模式下获得该锁的本机进程,而服务器锁仅仅确保保持了DLM(500)锁,而不排斥其他本机进程)。
4.它允许客户端为不同类型的锁定义主叫(callout),当与锁相关的某些事件发生的时候,特别是当获取和放弃DLM 500级的锁的时候。这一能力是高速缓存器一致性的要求,其依赖于主叫,以便在相应的DLM 500写入锁被降级或者释放的时候将修改的高速缓存数据刷新到持久存储器,并在DLM 500读取锁被释放的时候净化高速缓存数据。
LCL 502是作出来自用户级DLM 500的锁请求的唯一内核组件。它在内核客户端之间划分DLM 500锁,以致单一DLM 500锁在每一节点上至多具有一个内核客户端,也就是LCL 502本身。每一DLM 500锁都是一个LCL 502请求的产物,它是由一个LCL 502锁的客户端请求引发的,并且每一LCL 502锁都由一个DLM 500锁作为后备。
所述矩阵文件系统504是矩阵服务器的共享文件系统组件。矩阵文件系统504允许多个服务器同时地以读/写模式配置(mount)活动于物理共享存储装置306a-306d之上的文件系统。矩阵文件系统504是一种分布式的对称矩阵文件系统;不存在文件系统活动必须经过其以便执行文件系统活动的单个服务器。矩阵文件系统504为文件系统的客户端提供正常的本机文件系统语义和接口。
SAN(存储区域网络)成员资格服务506为矩阵文件系统504提供组成员资格服务基础架构,包括管理文件系统成员资格、健康状态监视、协调共享文件系统306a-306d的配置和解配置,以及协调崩溃恢复。
矩阵成员资格服务508提供本机的矩阵型式的矩阵成员资格支持,包括虚拟主机管理、服务监视、通知服务、数据复制、等等。矩阵文件系统504不与MMS 508直接地接口,而是矩阵文件系统504与SAN成员资格服务506接口,然后SAN成员资格服务506与MMS 508接口,以便为文件系统504提供矩阵组服务基础架构。
共享磁盘监视探测器(probe)510维护和监视矩阵中的各共享存储装置的成员资格。它获取和维护有关矩阵中的各共享存储装置的租用,以作为对于盗贼服务器(rogue server)“裂脑(split-brain)”状态的保护措施。它与SMS 506通信,以便在发生装置成员资格转移的时候协调恢复活动。
文件系统监视器512被SAN成员资格服务508用于依据被矩阵服务器用户接口置于适当位置的矩阵配置(configuration),来启动矩阵文件系统504配置和解配置。
服务监视器514跟踪该矩阵中的每一服务器上的各服务的状态(健康状态&可利用性),以便矩阵服务器可以在任一受监视的服务的状态转移的时候采取自动的补救措施。被监视的服务包括HTTP、FTP、Telnet、SMTP等等。补救措施包括在同一服务器上的服务重新启动,或者在另一服务器上的服务故障复原和重新启动。
装置监视器516跟踪该矩阵中的各存储相关装置的状态(健康状态&可利用性),以便矩阵服务器可以在任一被监视的装置的状态转移的时候采取自动的补救措施。被监视的装置可以包括数据存储装置306a-306d(例如存储装置驱动器、固态存储装置、随机存取存储装置、JOBD、RAID阵列、等等)以及存储网络装置304′(例如光纤通道交换机、Infiniband交换机、iSCSI交换机等等)。补救措施包括矩阵文件系统504恢复的启动、存储网络路径故障复原、以及装置重置。
所述应用监视器518跟踪所述矩阵中的每一服务器上的各种应用的状态(健康状态&可利用性),以致该矩阵服务器可以在任一被监视的应用的状态转移的时候采取自动的补救措施。被监视的应用可以包括数据库、邮件路由器、CRM应用、等等。所述补救措施包括在同一服务器上应用重新启动,或者是在另一服务器上的应用故障复原和重新启动。
通知者代理器520跟踪与所述矩阵中的指定对象相关联的事件,并且在任一被跟踪的事件发生的时候执行所提供的命令脚本。
复制者代理器522监视任一文件系统子树的内容,并且周期地复制还没有被从源树复制到目的树的任何数据。优选的是,复制被用于没有被放入共享存储器中的子树。
所述矩阵通信服务524为DLM 500、矩阵成员资格服务508、以及SAN成员资格服务506提供网络通信基础架构。所述矩阵文件系统504不直接使用MCS 524,而是经由这些其他组件间接地使用它。
存储控制层(SCL)526提供矩阵宽的设备标识,用于在配置时间标识矩阵文件系统504。SCL 526还管理存储器光纤配置以及将包含所述矩阵文件系统504的共享存储装置306a-306d与盗贼服务器隔离的低级I/O设备。还为矩阵中的服务器提供了在正常设备操作期间进行自动仲裁的能力,以便当已经丢失了与其余矩阵通信的时候隔离它自己。
存储控制层526是负责管理共享存储装置306a-306d的矩阵服务器模块。在上下文中,管理包括两个基本功能。第一是通过允许/禁止主机对所述组的共享存储装置306a-306d的存取,来强迫在硬件SAN级的I/O隔离。并且,第二是为所有矩阵存储装置306a-306d产生全局的(矩阵宽的)唯一的设备名(或者“标签”),并且确保所述矩阵中的所有主机能访问那些全局的设备名。所述SCL模块还包括向UI提供设备信息所需要的应用和库例程。
伪存储器驱动器528是一种分层的驱动器,其“隐藏”目标存储装置306a-306d,以致对于底层的目标装置的所有引用必须经过所述PSD分层驱动器。因而,所述PSD提供了“隔离”装置的能力,其阻塞从主机服务器到底层的目标装置的所有I/O,直到再次变为去隔离为止。PSD还提供一种应用级接口,用于锁定跨过所述矩阵的存储器划分。它还具有提供到设备的普通的矩阵宽的“句柄”或者路径的能力,以致所有访问所述矩阵服务器中的共享存储器的服务器能够使用相同的路径来访问给定的共享装置。
图6是依据本发明的一个实施例的、用于多节点环境的方法的流程图。在本范例中,提供(600)了第一操作系统,并且还提供(602)了第二操作系统。优选的是,所述第二操作系统独立于所述第一操作系统。它们能够是相同的操作系统,例如两个操作系统都是Linux,或者能够是不同的操作系统,例如Window的不同的版本,或者Unix和Linux,但是每一个均运行独立的OS而不是一个组合的OS。还提供(604)了存储器。然后提供了(606)将所述第一操作系统与所述存储器耦合、以及将所述第二操作系统与所述存储器耦合的互连。然后,所述存储器由所述第一操作系统直接访问(608),并且所述存储器还由所述第二操作系统直接访问(610)。
图7A-7C是依据本发明的实施例的、用于多节点环境的方法的其他流程图。在这里使用了下列术语。
在这里使用了组成员资格来指形成一个通信组的一组协作进程(程序)。例如,能够在服务器之间形成一个组成员资格。在这里使用SAN成员资格来指存储区域成员资格。SAN成员资格指进行通信的服务器组,这些服务器被允许对诸如磁盘和交换机之类的存储区域网络资源进行读/写。在这里使用共享存储器组成员资格来指主动地使用位于SAN上的单个文件系统的服务器组。一个范例是已经“配置”所述文件系统、以使其能够由用户程序存取的服务器组。集群成员资格指形成单个集群的服务器组,其主动地将文件系统和网络资源作为逻辑整体来共享。
在本范例中,一个服务器集群的成员资格被确定(700)。正如前面提到的那样,使用了服务器作为范例,然而能使用任何节点、计算机或者处理器。如在这里使用的集群,能够是与成员资格相关联的任何两个或更多服务器、计算机、处理器或者它们的任何组合。
然后确定所述集群的成员资格是否已经改变(702)。在时间零点,由于没有成员资格的历史,所以成员资格没有变化。在以后的某一时间,所述成员资格可能改变,例如如果一个服务器离线,或者添加了一个新的服务器。除在使用的服务器的数目方面的变化之外,确定成员资格是否已经改变还可以适用于一个服务器已经出现故障、已经添加了一个服务器或者已经将一个服务器从该集群中去掉的情况。
如果该集群成员资格未曾变化(702),则每一个服务器均向其他服务器发送消息,并且监视该消息,以便看看其他服务器是否是活动的(704)。然后确定是否所有的服务器响应(706)。如果该集群中的所有其他服务器对该消息作出响应,则该存储区域网络(SAN)成员资格服务(SMS)被通知该集群的活动成员(708)。然而,如果该集群中的所有的服务器都不响应(706),则该消息活动被阻塞(716)。阻塞消息活动避免了成员资格变化之间的过期的消息。一旦消息活动被阻塞了,则再次确定该集群的成员资格(700)。
如果已经改变了该集群成员资格(702),则不再授权新的锁(710)。然后确定在这一集群中是否存在一个管理员(ADM)(712)。
如果在这一集群中没有管理员,则该集群中的成员中的一个被选作管理员(714)。在图5中所示范例中,SAN成员资格服务(SMS)506能被用作管理员。
所述管理员验证:在这一集群中的其他服务器是图7B中的这一存储区域成员资格(720)的部分。步骤720对于当所有服务器都是该集群的一部分的时候、以及当存在该集群外部的服务器的时候这两种情况都适用。
设计好地或者偶然地,有在该存储区域网络中工作的单独的集群。在任一情况下,错误配置了软件的服务器可能导致在对有效的集群不了解的情况下,一个连接到该共享存储器并且试图访问它的服务器。如果节点在该集群的外部,则管理员排斥(隔离)那些服务器,以便阻止共享存储器上的数据损坏。然后,成功地赢得该网络集群的成员资格的服务器被允许访问该共享存储器,并且因而成为该SAN成员资格的部分。
然后所有的非集群成员被排斥,并且所有的集群成员被允许进入所述共享存储器组(722)。相应地,该集群成员资格外部的服务器被排斥访问图5中的盘306A-306D。
然后共享存储器被设置等于一(724)。由ADM确定对于这一共享存储器组的一个成员来讲是否需要恢复(726)。
如果对于这一共享存储器组的一个成员来讲不需要恢复,则确定这是否是最后一个共享存储器(732)。如果不是最后一个共享存储器,则共享存储器被设置为共享存储器加上一(730),并且通过让管理员确定该共享存储器中的一个成员是否需要恢复来评估下一共享存储器(726)。然而,如果这一共享存储器是最后一个共享存储器,则为可访问的共享存储器恢复新锁的授权(734)。
如果管理员确定对于这一共享存储器的一个成员来讲需要恢复(726),则确定这一共享存储器中的哪一成员(或哪些成员)需要恢复(728)。例如,每一个服务器的SAN成员资格服务(SMS)能够向它们的分布式锁管理器(DLM)告知该服务器是否需要恢复。
需要恢复的服务器被分析。在本范例中,用于需要恢复的成员的DLM被设定等于一(750)。然后恢复了能够通过矩阵文件系统(MFS)和锁高速缓存层(LCL)触发共享存储器中的日志恢复的锁。
然后确定恢复是否成功过(754)。如果恢复成功过,则确定这一服务器是否曾是需要恢复的最后一个服务器(762)。如果这一服务器不曾是需要恢复的最后一个服务器,则通过设定DLM等于DLM加上一来分析需要恢复的下一服务器(764)。然后为这一个下一服务器恢复锁(752)。然而,如果这一服务器曾是需要恢复的最后一个服务器(762),则确定这一共享存储器是否是需要被分析的最后一个共享存储器(图7B中的732)。
如果该锁的恢复不曾成功过(图7C中的754),则出现故障的共享存储器被标记为错误(756),并且警报被发送给人类系统操作员(758)。
然后,出现故障的共享存储器被隔离,并且对该共享存储器的存取被阻止(760)。然后确定这一共享存储器是否是需要被分析的最后一个共享存储器(图7B中的732)。
图8是依据本发明的一个实施例的、用于从共享存储器中读取文件的方法的流程图。一个集群中的一个服务器的操作系统请求读取一个文件的一部分(800)。
提供了共享锁请求(802)。例如,图5中的矩阵文件系统(MFS)504向图5中的锁高速缓存层(LCL)502要求共享锁。然后确定该请求是否被授权(804)。如果对共享锁的请求没有被授权,则确定是否存在共享存储器故障(806)。
如果存在共享存储器故障,则该共享存储器在必要时被隔离(808)。然而,如果没有共享存储器故障,则MFS向LCL要求共享锁(802)。然后确定该共享锁请求是否被授权(804)。
如果该共享锁请求被授权(804),则确定该服务器是否能够将一个所请求的文件从共享存储器中读取到操作系统缓冲高速缓存器里(810)。如果该服务器能够将该文件读取到OS缓冲高速缓存器里,则该过程完成。然而,如果该服务器无法读取到OS缓冲高速缓存器里,则共享锁被撤消,并且错误被返回到该操作系统或者应用(812)。这样一种错误可能发生的时间的范例是是否存在磁盘故障或者连接故障。
图9A-9B是依据本发明的一个实施例的、向共享存储器中写入文件的方法的流程图。
在本范例中,一个服务器的操作系统请求写一个文件的一部分(900)。图5中的矩阵文件系统(MFS)504向锁高速缓存层(LCL)502要求互斥锁(902)。然后确定所述对互斥锁的请求是否被授权(904)。如果对互斥锁的请求没有被授权,则确定是否存在共享存储器故障(920)。如果存在共享存储器故障,则该共享存储器在必要时被隔离(922)。然而,如果没有共享存储器故障(920),则存在另一个对互斥锁的请求(902)。
如果对互斥锁的请求被授权(904),则确定在本机高速缓存器中是否存在被请求的文件部分的稳定副本(906)。如果在高速缓存器中存在稳定的副本,则在本机高速缓存器中修改这篇文件(图9B中的934)。然而,如果在本机高速缓存器没有稳定的副本(906),则确定这篇被请求的文件是否能够被成功地从共享存储器中读取到操作系统本机高速缓存器中(930)。如果服务器无法将该文件读取到本机高速缓存器里,则错误被返回到操作系统或者应用(932)。然而,如果该文件曾被成功地读取到本机高速缓存器里,则在本机高速缓存器中修改这篇文件(934)。
然后确定是否已经接收了对用于这一特定文件的锁的请求(936)。如果已经接收了对用于这一文件的锁的请求,并且已经修改了该文件,则修改的数据被写入共享存储器(940)。然后服务器放弃对这一文件的互斥锁(938)。
如果还没有接收到对用于这一文件的锁的请求(936),则确定该操作系统是否正在清除该本机高速缓存器(942)。如果该高速缓存器正在被清除,则修改的数据被写入共享存储器(940),并且维护任何锁,除非存在来自另一个服务器的未解决的请求。不然,该修改的文件被保留在本机高速缓存器中(944)。通过将修改的文件保留在本机高速缓存器中直到它被另一个服务器需要为止,对于将该文件保持在它的本机高速缓存器中的服务器访问该文件变得更快。
图10A-10B是依据本发明的一个实施例的、用于将一个节点添加到共享诸如磁盘的服务器集群的方法的流程图。
在本范例中,确定在该集群中是否存在一个管理员(ADM)(1400)。该集群包括协作共享诸如共享存储器的共享资源的服务器组。所述集群中的服务器之一充当管理员,来管理该集群。如果在该集群中没有管理员,则确定这一服务器是否能够设法变为管理员(1408)。如果这一服务器能够设法变为管理员,则该服务器从数据库中读取设备信息,并且它现在成为新的管理员(1410)。
如果在该集群中存在一个管理员(1400),或者如果这一服务器无法变为新的管理员(1408),则要求现有的管理员进入该集群(1402)。这一服务器如何无法变为管理员(1408)的一个范例是在这一服务器确立没有管理员并且随后其设法变为管理员的期间,另一个服务器是否变为管理员。
然后确定是否允许这一服务器进入该集群(1404)。如果不允许,那么将这一服务器添加到该集群的过程失败(1412)。为什么添加服务器可能出现故障的理由的范例包括这一服务器不健康,或者具有与由管理员使用的生成号码不匹配的存储区域网络生成号码。
如果这一服务器能够进入(1404),则它从管理员那里接收设备名(1406)。设备名的范例包括共享存储器的名称。
管理员授权物理存储区域网络访问这一服务器(图10B中的1410)。然后管理员命令该物理硬件允许这一服务器存储区域网络(SAN)访问(1412)。现在这一服务器有权访问SAN(1414)。
图11A-11C是根据本发明的、用于处理服务器故障的方法的流程图。在本范例中,确定服务器或者与服务器的通信发生故障(1700)。然后确定是否还存在一个管理员(1702)。例如,出现故障的服务器可能已经是管理员。如果还存在一个管理员,则出现故障的服务器被物理上隔离(1708)。物理上隔离出现故障的服务器的范例是禁止与该出现故障的服务器相关联的端口。
然后,存储区域网络生成号码被更新并且被存储到数据库(1710)。此后,正常操作继续(1712)。
如果不再有管理员(1702),则选择一个服务器,来设法变为新的管理员(1704)。存在几种方式来选择一个服务器设法变为新的管理员。一个范例是随机选择服务器之一。然后被选择的服务器被告知设法变为新的管理员(1706)。服务器如何被选择并且被告知变为新的管理员的一个范例是通过使用组协调器。
在一个实施例中,在利用一种算法在构造进程通信组的期间选择所述组协调器,所述算法能够在除了要求符合该组的成员资格之外、不与任何服务器或节点通信的情况下唯一地标识该组协调器。例如,选择成员中具有最低号码的成员网际协议(IP)地址的服务器。然后,协调器能为该服务器组产生全局决策,例如选择一个可允许的管理员。优选的是,被选择作为管理员的服务器是具有实际上变为管理员的高成功概率的一个。组协调器试图将该管理员放置在能连接SAN硬件、并且最近在试图变为SAN管理员的时候没有失败的节点上。
然后,被选择的服务器试图获取存储区域网络锁(1720)。如果它无法获取SAN锁,则它没能变为管理员(1724)。如果它成功获取SAN锁(1720),则它试图从成员资格数据库中读取SAN生成号码(1722)。数据库能够被维护在共享存储器上的成员资格划分之一中,或者能够与SAN锁一起驻留。
如果服务器没能从数据库中读取SAN生成号码(1722),则其撤消SAN锁(1726),并且它没能变为管理员(1724)。一旦服务器没能变为管理员(1724),则组协调器告知一个服务器设法变为新的管理员(图5A中的1706)。
如果服务器能够从数据库中读取SAN生成号码,则它将SAN生成号码加1,并将其存储回数据库(1728)。它还告知组协调器:现在,这一服务器是管理员(1730)。组协调器接收该管理员更新(1732)。然后确定是否允许这一服务器成为新的管理员(1750)。如果不允许,则一个用于撤消管理员状态的消息被发送给当前设法变为管理员的服务器(1752)。此后,该组协调器告诉另一个服务器设法成为新的管理员(图11A中的1706)。
如果允许这一服务器成为新的管理员,则管理员被告知提交(1754),并且该管理员被提交(1756)。然后协调器将该新的管理员告知该集群中的其他服务器(1758)。
图12是依据本发明的一个实施例的、用于添加或除去共享存储器的方法的流程图。在本范例中,从一个服务器向管理员发送一个请求,用于添加或除去一个共享存储器(1600),例如磁盘。然后该磁盘被添加到指定数据库或从指定数据库中除去(1602)。能够在可由所有的服务器访问的共享存储器上维护所述指定数据库,并且能够在所有的服务器加入该集群的时候被它们预先知道该指定数据库。优选的是,不了解指定数据库的位置的服务器没有资格成为SAN管理员。
然后SAN生成号码加1(1604)。然后,该集群中的每一个服务器均被通知该SAN生成号码以及新的磁盘的添加或者删除(1606)。当该集群中的所有的服务器都知道的时候,新的SAN生成号码被写入数据库(1608)。然后请求服务器被通知:磁盘的添加/删除完成(1610)。
尽管已经为了理解得清晰而相当详细地说明了上述发明,但是显然可在所附加的权利要求书的范围内实践某些改变和修改。应被注意的是,存在许多可供选择的方法来实现本发明的过程和设备两者。相应地,本实施例被认为是例证性的而非限制性的,并且本发明不被限制在此处给出的细节,而可以在所附加的权利要求书的范围和等效物之内进行修改。

Claims (17)

1.一种用于多节点环境的系统,包括:
与第一操作系统相关联的第一节点;
与第二操作系统相关联的第二节点,其中所述第二操作系统独立于所述第一操作系统;
存储器;以及
将所述第一节点与所述存储器耦合并将所述第二节点与所述存储器耦合的互连;以及
其中所述第一节点直接访问所述存储器,并且所述第二节点直接访问所述存储器。
2.如权利要求1所述的系统,其中,所述第一操作系统是与所述第二操作系统不同的操作系统。
3.如权利要求1所述的系统,其中,所述存储器是相干共享文件存储器。
4.如权利要求1所述的系统,进一步包括被动态地添加的第三节点,以致所述第三节点直接访问所述存储器。
5.如权利要求1所述的系统,其中,所述第二节点被动态地去耦合,其中所述第二节点不再直接访问所述存储器。
6.如权利要求1所述的系统,进一步包括被动态地添加的第二存储器,以致所述第二存储器可由所述第一和第二节点直接访问。
7.如权利要求1所述的系统,进一步包括第二存储器,其中所述第二存储器可由所述第一和第二节点直接访问,并且其中所述第二存储器被动态地与所述第一和第二节点去耦合,以致所述第二存储器不可再由所述第一和第二节点直接访问。
8.一种用于多节点环境的系统,包括:
与成员资格组相关联的第一节点,其中所述第一节点与第一操作系统相关联;
与所述成员资格组相关联的第二节点,其中所述第二节点与第二操作系统相关联,并且其中所述第二操作系统独立于所述第一操作系统;和
与所述第一和第二节点耦合的存储器,所述存储器可由所述第一节点和所述第二节点直接访问;以及
其中所述第一节点被配置为确定所述成员资格组是否已经改变。
9.如权利要求8所述的系统,其中,所述第一节点针对成员资格组中的改变动态地调节。
10.一种用于管理多节点环境的方法,包括:
将第一节点与成员资格组相关联,其中所述第一节点与第一操作系统相关联,并且其中所述第一节点直接访问存储器;
将第二节点与所述成员资格组相关联,其中所述第二节点与第二操作系统相关联,并且其中所述第二操作系统独立于所述第一操作系统,并且其中所述第二节点直接访问所述存储器;
确定所述成员资格组是否已经改变;以及
针对成员资格组中的变化而动态地调节。
11.如权利要求10所述的方法,其中,所述第一操作系统是与所述第二操作系统不同的操作系统。
12.如权利要求10所述的方法,其中,所述成员资格组由于将第三节点添加到所述成员资格组而改变。
13.如权利要求10所述的方法,其中,第三节点与所述成员资格组相关联,并且其中所述成员资格组由于从所述成员资格组中减去所述第三节点而改变。
14.如权利要求10所述的方法,进一步包括如果所述成员资格组已经改变,确定是否需要执行恢复。
15.如权利要求10所述的方法,进一步包括如果成员资格组已经改变并且如果需要恢复,恢复锁。
16.如权利要求10所述的方法,进一步包括如果成员资格组已经改变则停止授权新的锁。
17.一种用于将第一节点配置为与多节点环境相关联的系统,包括:
处理单元,被配置为与第一操作系统相关联,其中所述第一操作系统独立于第二节点的第二操作系统;所述处理单元还被配置为能够确定成员资格组是否已经改变,其中所述成员资格组与所述第一节点和所述第二节点相关联;并且还被配置为能够针对成员资格组中的变化进行动态地调节;以及,
与所述处理单元耦合的存储装置,其中所述存储装置被配置为可由处理单元直接访问,并且还被配置为可由所述第二节点直接访问。
CNB028230981A 2001-09-21 2002-09-20 用于具有共享存储器的多节点环境的系统和方法 Expired - Lifetime CN1302419C (zh)

Applications Claiming Priority (16)

Application Number Priority Date Filing Date Title
US32422401P 2001-09-21 2001-09-21
US32419601P 2001-09-21 2001-09-21
US32422601P 2001-09-21 2001-09-21
US32419501P 2001-09-21 2001-09-21
US32424201P 2001-09-21 2001-09-21
US32424301P 2001-09-21 2001-09-21
US60/324,243 2001-09-21
US60/324,787 2001-09-21
US60/324,195 2001-09-21
US60/324,226 2001-09-21
US60/324,196 2001-09-21
US60/324,242 2001-09-21
US60/324,224 2001-09-21
US32478701P 2001-09-24 2001-09-24
US32719101P 2001-10-01 2001-10-01
US60/327,191 2001-10-01

Publications (2)

Publication Number Publication Date
CN1589447A CN1589447A (zh) 2005-03-02
CN1302419C true CN1302419C (zh) 2007-02-28

Family

ID=27575390

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB028230981A Expired - Lifetime CN1302419C (zh) 2001-09-21 2002-09-20 用于具有共享存储器的多节点环境的系统和方法
CNB028232313A Expired - Lifetime CN1320483C (zh) 2001-09-21 2002-09-20 用于在多节点环境中实施日志处理的系统和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNB028232313A Expired - Lifetime CN1320483C (zh) 2001-09-21 2002-09-20 用于在多节点环境中实施日志处理的系统和方法

Country Status (7)

Country Link
US (8) US7240057B2 (zh)
EP (2) EP1428151A4 (zh)
JP (2) JP2005504369A (zh)
CN (2) CN1302419C (zh)
AU (1) AU2002341784A1 (zh)
CA (2) CA2460833C (zh)
WO (5) WO2003025801A1 (zh)

Families Citing this family (191)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7412462B2 (en) * 2000-02-18 2008-08-12 Burnside Acquisition, Llc Data repository and method for promoting network storage of data
US6890968B2 (en) * 2001-05-16 2005-05-10 Kerr Corporation Prepolymerized filler in dental restorative composite
US8010558B2 (en) 2001-06-05 2011-08-30 Silicon Graphics International Relocation of metadata server with outstanding DMAPI requests
US7640582B2 (en) 2003-04-16 2009-12-29 Silicon Graphics International Clustered filesystem for mix of trusted and untrusted nodes
US7617292B2 (en) 2001-06-05 2009-11-10 Silicon Graphics International Multi-class heterogeneous clients in a clustered filesystem
US20040139125A1 (en) 2001-06-05 2004-07-15 Roger Strassburg Snapshot copy of data volume during data access
US7702791B2 (en) 2001-07-16 2010-04-20 Bea Systems, Inc. Hardware load-balancing apparatus for session replication
US7409420B2 (en) * 2001-07-16 2008-08-05 Bea Systems, Inc. Method and apparatus for session replication and failover
US7571215B2 (en) * 2001-07-16 2009-08-04 Bea Systems, Inc. Data replication protocol
US7113980B2 (en) 2001-09-06 2006-09-26 Bea Systems, Inc. Exactly once JMS communication
US6826601B2 (en) 2001-09-06 2004-11-30 Bea Systems, Inc. Exactly one cache framework
US7240057B2 (en) * 2001-09-21 2007-07-03 Kingsbury Brent A System and method for implementing journaling in a multi-node environment
US7403996B2 (en) 2002-02-21 2008-07-22 Bea Systems, Inc. Systems and methods for migratable services
US7178050B2 (en) * 2002-02-22 2007-02-13 Bea Systems, Inc. System for highly available transaction recovery for transaction processing systems
US7096213B2 (en) * 2002-04-08 2006-08-22 Oracle International Corporation Persistent key-value repository with a pluggable architecture to abstract physical storage
AU2003214624A1 (en) * 2002-04-25 2003-11-10 Kashya Israel Ltd. An apparatus for continuous compression of large volumes of data
US20030220943A1 (en) * 2002-05-23 2003-11-27 International Business Machines Corporation Recovery of a single metadata controller failure in a storage area network environment
US7774325B2 (en) * 2002-10-17 2010-08-10 Intel Corporation Distributed network attached storage system
CN1711606A (zh) * 2002-11-07 2005-12-21 皇家飞利浦电子股份有限公司 具有主文件系统区域和虚拟文件系统区域的记录载体
US7457906B2 (en) * 2003-01-21 2008-11-25 Nextio, Inc. Method and apparatus for shared I/O in a load/store fabric
US7613797B2 (en) * 2003-03-19 2009-11-03 Unisys Corporation Remote discovery and system architecture
GB0308923D0 (en) * 2003-04-17 2003-05-28 Ibm Low-overhead storage cluster configuration locking
US7409389B2 (en) 2003-04-29 2008-08-05 International Business Machines Corporation Managing access to objects of a computing environment
US7376744B2 (en) * 2003-05-09 2008-05-20 Oracle International Corporation Using local locks for global synchronization in multi-node systems
US20040230896A1 (en) * 2003-05-16 2004-11-18 Dethe Elza Method and system for enabling collaborative authoring of hierarchical documents with unique node identifications
CA2429375A1 (en) * 2003-05-22 2004-11-22 Cognos Incorporated Model action logging
WO2005008434A2 (en) * 2003-07-11 2005-01-27 Computer Associates Think, Inc. A distributed locking method and system for networked device management
US7739541B1 (en) 2003-07-25 2010-06-15 Symantec Operating Corporation System and method for resolving cluster partitions in out-of-band storage virtualization environments
US7356531B1 (en) * 2003-07-25 2008-04-08 Symantec Operating Corporation Network file system record lock recovery in a highly available environment
US8234517B2 (en) * 2003-08-01 2012-07-31 Oracle International Corporation Parallel recovery by non-failed nodes
US7584454B1 (en) * 2003-09-10 2009-09-01 Nextaxiom Technology, Inc. Semantic-based transactional support and recovery for nested composite software services
US20050091215A1 (en) * 2003-09-29 2005-04-28 Chandra Tushar D. Technique for provisioning storage for servers in an on-demand environment
US7234073B1 (en) * 2003-09-30 2007-06-19 Emc Corporation System and methods for failover management of manageable entity agents
US7581205B1 (en) 2003-09-30 2009-08-25 Nextaxiom Technology, Inc. System and method of implementing a customizable software platform
US8225282B1 (en) 2003-11-25 2012-07-17 Nextaxiom Technology, Inc. Semantic-based, service-oriented system and method of developing, programming and managing software modules and software solutions
US20050138154A1 (en) * 2003-12-18 2005-06-23 Intel Corporation Enclosure management device
US7155546B2 (en) * 2003-12-18 2006-12-26 Intel Corporation Multiple physical interfaces in a slot of a storage enclosure to support different storage interconnect architectures
US7376147B2 (en) * 2003-12-18 2008-05-20 Intel Corporation Adaptor supporting different protocols
US8543781B2 (en) 2004-02-06 2013-09-24 Vmware, Inc. Hybrid locking using network and on-disk based schemes
US8560747B1 (en) 2007-02-16 2013-10-15 Vmware, Inc. Associating heartbeat data with access to shared resources of a computer system
US20110179082A1 (en) * 2004-02-06 2011-07-21 Vmware, Inc. Managing concurrent file system accesses by multiple servers using locks
US10776206B1 (en) * 2004-02-06 2020-09-15 Vmware, Inc. Distributed transaction system
US8700585B2 (en) * 2004-02-06 2014-04-15 Vmware, Inc. Optimistic locking method and system for committing transactions on a file system
US7849098B1 (en) * 2004-02-06 2010-12-07 Vmware, Inc. Providing multiple concurrent access to a file system
JP4485256B2 (ja) * 2004-05-20 2010-06-16 株式会社日立製作所 記憶領域の管理方法及び管理システム
US7962449B2 (en) * 2004-06-25 2011-06-14 Apple Inc. Trusted index structure in a network environment
US7730012B2 (en) 2004-06-25 2010-06-01 Apple Inc. Methods and systems for managing data
US8131674B2 (en) 2004-06-25 2012-03-06 Apple Inc. Methods and systems for managing data
US7386752B1 (en) * 2004-06-30 2008-06-10 Symantec Operating Corporation Using asset dependencies to identify the recovery set and optionally automate and/or optimize the recovery
US7769734B2 (en) * 2004-07-26 2010-08-03 International Business Machines Corporation Managing long-lived resource locks in a multi-system mail infrastructure
WO2006015536A1 (fr) * 2004-08-08 2006-02-16 Huawei Technologies Co. Ltd. Procede de notification d'une operation d'enregistrement
US20060041559A1 (en) * 2004-08-17 2006-02-23 International Business Machines Corporation Innovation for managing virtual storage area networks
US20060059269A1 (en) * 2004-09-13 2006-03-16 Chien Chen Transparent recovery of switch device
US7310711B2 (en) * 2004-10-29 2007-12-18 Hitachi Global Storage Technologies Netherlands B.V. Hard disk drive with support for atomic transactions
US7496701B2 (en) * 2004-11-18 2009-02-24 International Business Machines Corporation Managing virtual server control of computer support systems with heartbeat message
JP4462024B2 (ja) 2004-12-09 2010-05-12 株式会社日立製作所 ディスク引き継ぎによるフェイルオーバ方法
US8495266B2 (en) * 2004-12-10 2013-07-23 Hewlett-Packard Development Company, L.P. Distributed lock
US7506204B2 (en) * 2005-04-25 2009-03-17 Microsoft Corporation Dedicated connection to a database server for alternative failure recovery
US20060242453A1 (en) * 2005-04-25 2006-10-26 Dell Products L.P. System and method for managing hung cluster nodes
JP4648751B2 (ja) * 2005-05-02 2011-03-09 株式会社日立製作所 記憶制御システム及び記憶制御方法
US7631016B2 (en) * 2005-05-04 2009-12-08 Oracle International Corporation Providing the latest version of a data item from an N-replica set
US7356653B2 (en) * 2005-06-03 2008-04-08 International Business Machines Corporation Reader-initiated shared memory synchronization
US7437426B2 (en) * 2005-09-27 2008-10-14 Oracle International Corporation Detecting and correcting node misconfiguration of information about the location of shared storage resources
US8060713B1 (en) 2005-12-21 2011-11-15 Emc (Benelux) B.V., S.A.R.L. Consolidating snapshots in a continuous data protection system using journaling
US7774565B2 (en) * 2005-12-21 2010-08-10 Emc Israel Development Center, Ltd. Methods and apparatus for point in time data access and recovery
US7849361B2 (en) * 2005-12-22 2010-12-07 Emc Corporation Methods and apparatus for multiple point in time data access
US7836033B1 (en) * 2006-01-24 2010-11-16 Network Appliance, Inc. Method and apparatus for parallel updates to global state in a multi-processor system
US20070180287A1 (en) * 2006-01-31 2007-08-02 Dell Products L. P. System and method for managing node resets in a cluster
US7577867B2 (en) * 2006-02-17 2009-08-18 Emc Corporation Cross tagging to data for consistent recovery
US7552148B2 (en) * 2006-02-28 2009-06-23 Microsoft Corporation Shutdown recovery
US7899780B1 (en) * 2006-03-30 2011-03-01 Emc Corporation Methods and apparatus for structured partitioning of management information
CN100383750C (zh) * 2006-06-07 2008-04-23 中国科学院计算技术研究所 一种面向大规模计算系统的高可信日志系统实现方法
US7734960B2 (en) * 2006-08-14 2010-06-08 Hewlett-Packard Development Company, L.P. Method of managing nodes in computer cluster
US7886034B1 (en) * 2006-09-27 2011-02-08 Symantec Corporation Adaptive liveness management for robust and efficient peer-to-peer storage
US7627687B2 (en) * 2006-09-28 2009-12-01 Emc Israel Development Center, Ltd. Methods and apparatus for managing data flow in a continuous data replication system having journaling
US7627612B2 (en) * 2006-09-28 2009-12-01 Emc Israel Development Center, Ltd. Methods and apparatus for optimal journaling for continuous data replication
US20080082533A1 (en) * 2006-09-28 2008-04-03 Tak Fung Wang Persistent locks/resources for concurrency control
US8024521B2 (en) * 2007-03-13 2011-09-20 Sony Computer Entertainment Inc. Atomic operation on non-standard sized data using external cache
US7778986B2 (en) * 2007-08-29 2010-08-17 International Business Machines Corporation Securing transfer of ownership of a storage object from an unavailable owner node to another node
US7921272B2 (en) * 2007-10-05 2011-04-05 International Business Machines Corporation Monitoring patterns of processes accessing addresses in a storage device to determine access parameters to apply
US7856536B2 (en) * 2007-10-05 2010-12-21 International Business Machines Corporation Providing a process exclusive access to a page including a memory address to which a lock is granted to the process
US7770064B2 (en) * 2007-10-05 2010-08-03 International Business Machines Corporation Recovery of application faults in a mirrored application environment
US8055855B2 (en) * 2007-10-05 2011-11-08 International Business Machines Corporation Varying access parameters for processes to access memory addresses in response to detecting a condition related to a pattern of processes access to memory addresses
US8041940B1 (en) 2007-12-26 2011-10-18 Emc Corporation Offloading encryption processing in a storage area network
US7958372B1 (en) 2007-12-26 2011-06-07 Emc (Benelux) B.V., S.A.R.L. Method and apparatus to convert a logical unit from a first encryption state to a second encryption state using a journal in a continuous data protection environment
US7840536B1 (en) 2007-12-26 2010-11-23 Emc (Benelux) B.V., S.A.R.L. Methods and apparatus for dynamic journal expansion
US7860836B1 (en) 2007-12-26 2010-12-28 Emc (Benelux) B.V., S.A.R.L. Method and apparatus to recover data in a continuous data protection environment using a journal
US9178785B1 (en) 2008-01-24 2015-11-03 NextAxiom Technology, Inc Accounting for usage and usage-based pricing of runtime engine
US9501542B1 (en) 2008-03-11 2016-11-22 Emc Corporation Methods and apparatus for volume synchronization
US7719443B1 (en) 2008-06-27 2010-05-18 Emc Corporation Compressing data in a continuous data protection environment
US7840730B2 (en) 2008-06-27 2010-11-23 Microsoft Corporation Cluster shared volumes
US8108634B1 (en) 2008-06-27 2012-01-31 Emc B.V., S.A.R.L. Replicating a thin logical unit
US8719473B2 (en) * 2008-09-19 2014-05-06 Microsoft Corporation Resource arbitration for shared-write access via persistent reservation
US8060714B1 (en) 2008-09-26 2011-11-15 Emc (Benelux) B.V., S.A.R.L. Initializing volumes in a replication system
US7882286B1 (en) 2008-09-26 2011-02-01 EMC (Benelux)B.V., S.A.R.L. Synchronizing volumes for replication
WO2010041515A1 (ja) * 2008-10-06 2010-04-15 インターナショナル・ビジネス・マシーンズ・コーポレーション 複数のアプリケーションサーバにより共有データをアクセスするシステム
US8972515B2 (en) * 2009-03-30 2015-03-03 The Boeing Company Computer architectures using shared storage
US8296358B2 (en) * 2009-05-14 2012-10-23 Hewlett-Packard Development Company, L.P. Method and system for journaling data updates in a distributed file system
US8055615B2 (en) * 2009-08-25 2011-11-08 Yahoo! Inc. Method for efficient storage node replacement
US20110055494A1 (en) * 2009-08-25 2011-03-03 Yahoo! Inc. Method for distributed direct object access storage
US9311319B2 (en) * 2009-08-27 2016-04-12 Hewlett Packard Enterprise Development Lp Method and system for administration of storage objects
US20110093745A1 (en) * 2009-10-20 2011-04-21 Aviad Zlotnick Systems and methods for implementing test applications for systems using locks
US8510334B2 (en) 2009-11-05 2013-08-13 Oracle International Corporation Lock manager on disk
US8392680B1 (en) 2010-03-30 2013-03-05 Emc International Company Accessing a volume in a distributed environment
US8103937B1 (en) * 2010-03-31 2012-01-24 Emc Corporation Cas command network replication
US8381014B2 (en) 2010-05-06 2013-02-19 International Business Machines Corporation Node controller first failure error management for a distributed system
US20110276728A1 (en) * 2010-05-06 2011-11-10 Hitachi, Ltd. Method and apparatus for storage i/o path configuration
US8332687B1 (en) 2010-06-23 2012-12-11 Emc Corporation Splitter used in a continuous data protection environment
US9098462B1 (en) 2010-09-14 2015-08-04 The Boeing Company Communications via shared memory
US8478955B1 (en) 2010-09-27 2013-07-02 Emc International Company Virtualized consistency group using more than one data protection appliance
US8433869B1 (en) 2010-09-27 2013-04-30 Emc International Company Virtualized consistency group using an enhanced splitter
US8335771B1 (en) 2010-09-29 2012-12-18 Emc Corporation Storage array snapshots for logged access replication in a continuous data protection system
US8694700B1 (en) 2010-09-29 2014-04-08 Emc Corporation Using I/O track information for continuous push with splitter for storage device
US8589732B2 (en) 2010-10-25 2013-11-19 Microsoft Corporation Consistent messaging with replication
US8335761B1 (en) 2010-12-02 2012-12-18 Emc International Company Replicating in a multi-copy environment
US8812916B2 (en) 2011-06-02 2014-08-19 International Business Machines Corporation Failure data management for a distributed computer system
US9256605B1 (en) 2011-08-03 2016-02-09 Emc Corporation Reading and writing to an unexposed device
US8973018B2 (en) 2011-08-23 2015-03-03 International Business Machines Corporation Configuring and relaying events from a storage controller to a host server
US8694724B1 (en) * 2011-09-06 2014-04-08 Emc Corporation Managing data storage by provisioning cache as a virtual device
US8898112B1 (en) 2011-09-07 2014-11-25 Emc Corporation Write signature command
US8560662B2 (en) * 2011-09-12 2013-10-15 Microsoft Corporation Locking system for cluster updates
US9170852B2 (en) 2012-02-02 2015-10-27 Microsoft Technology Licensing, Llc Self-updating functionality in a distributed system
US20130290385A1 (en) * 2012-04-30 2013-10-31 Charles B. Morrey, III Durably recording events for performing file system operations
US9223659B1 (en) 2012-06-28 2015-12-29 Emc International Company Generating and accessing a virtual volume snapshot in a continuous data protection system
US9218295B2 (en) * 2012-07-13 2015-12-22 Ca, Inc. Methods and systems for implementing time-locks
US9336094B1 (en) 2012-09-13 2016-05-10 Emc International Company Scaleout replication of an application
US10235145B1 (en) 2012-09-13 2019-03-19 Emc International Company Distributed scale-out replication
US9081840B2 (en) * 2012-09-21 2015-07-14 Citigroup Technology, Inc. Methods and systems for modeling a replication topology
US9696939B1 (en) 2013-03-14 2017-07-04 EMC IP Holding Company LLC Replicating data using deduplication-based arrays using network-based replication
US9110914B1 (en) 2013-03-14 2015-08-18 Emc Corporation Continuous data protection using deduplication-based storage
US9383937B1 (en) 2013-03-14 2016-07-05 Emc Corporation Journal tiering in a continuous data protection system using deduplication-based storage
US8996460B1 (en) 2013-03-14 2015-03-31 Emc Corporation Accessing an image in a continuous data protection using deduplication-based storage
US9244997B1 (en) 2013-03-15 2016-01-26 Emc Corporation Asymmetric active-active access of asynchronously-protected data storage
US9081842B1 (en) 2013-03-15 2015-07-14 Emc Corporation Synchronous and asymmetric asynchronous active-active-active data access
US9152339B1 (en) 2013-03-15 2015-10-06 Emc Corporation Synchronization of asymmetric active-active, asynchronously-protected storage
US9069709B1 (en) 2013-06-24 2015-06-30 Emc International Company Dynamic granularity in data replication
US9087112B1 (en) 2013-06-24 2015-07-21 Emc International Company Consistency across snapshot shipping and continuous replication
US9146878B1 (en) 2013-06-25 2015-09-29 Emc Corporation Storage recovery from total cache loss using journal-based replication
US9454485B2 (en) 2013-08-01 2016-09-27 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Sharing local cache from a failover node
KR102165775B1 (ko) * 2013-10-25 2020-10-14 어드밴스드 마이크로 디바이시즈, 인코포레이티드 버스 잠금 및 변환 색인 버퍼 무효화를 수행하기 위한 방법 및 장치
US9367260B1 (en) 2013-12-13 2016-06-14 Emc Corporation Dynamic replication system
US9405765B1 (en) 2013-12-17 2016-08-02 Emc Corporation Replication of virtual machines
US9158630B1 (en) 2013-12-19 2015-10-13 Emc Corporation Testing integrity of replicated storage
US9372752B2 (en) * 2013-12-27 2016-06-21 Intel Corporation Assisted coherent shared memory
WO2015142339A1 (en) 2014-03-20 2015-09-24 Hewlett-Packard Development Company, L.P. Storage system transactions
US9189339B1 (en) 2014-03-28 2015-11-17 Emc Corporation Replication of a virtual distributed volume with virtual machine granualarity
US9686206B2 (en) * 2014-04-29 2017-06-20 Silicon Graphics International Corp. Temporal based collaborative mutual exclusion control of a shared resource
US9497140B2 (en) 2014-05-14 2016-11-15 International Business Machines Corporation Autonomous multi-node network configuration and self-awareness through establishment of a switch port group
US9274718B1 (en) 2014-06-20 2016-03-01 Emc Corporation Migration in replication system
US10082980B1 (en) 2014-06-20 2018-09-25 EMC IP Holding Company LLC Migration of snapshot in replication system using a log
US9619543B1 (en) 2014-06-23 2017-04-11 EMC IP Holding Company LLC Replicating in virtual desktop infrastructure
US10237342B2 (en) * 2014-09-17 2019-03-19 Dh2I Company Coordinated and high availability storage access
US10101943B1 (en) 2014-09-25 2018-10-16 EMC IP Holding Company LLC Realigning data in replication system
US10437783B1 (en) 2014-09-25 2019-10-08 EMC IP Holding Company LLC Recover storage array using remote deduplication device
US10324798B1 (en) 2014-09-25 2019-06-18 EMC IP Holding Company LLC Restoring active areas of a logical unit
US9529885B1 (en) 2014-09-29 2016-12-27 EMC IP Holding Company LLC Maintaining consistent point-in-time in asynchronous replication during virtual machine relocation
US9910621B1 (en) 2014-09-29 2018-03-06 EMC IP Holding Company LLC Backlogging I/O metadata utilizing counters to monitor write acknowledgements and no acknowledgements
US10496487B1 (en) 2014-12-03 2019-12-03 EMC IP Holding Company LLC Storing snapshot changes with snapshots
US9600377B1 (en) 2014-12-03 2017-03-21 EMC IP Holding Company LLC Providing data protection using point-in-time images from multiple types of storage devices
US9405481B1 (en) 2014-12-17 2016-08-02 Emc Corporation Replicating using volume multiplexing with consistency group file
US9632881B1 (en) 2015-03-24 2017-04-25 EMC IP Holding Company LLC Replication of a virtual distributed volume
US10296419B1 (en) 2015-03-27 2019-05-21 EMC IP Holding Company LLC Accessing a virtual device using a kernel
US9411535B1 (en) 2015-03-27 2016-08-09 Emc Corporation Accessing multiple virtual devices
US9678680B1 (en) 2015-03-30 2017-06-13 EMC IP Holding Company LLC Forming a protection domain in a storage architecture
US10853181B1 (en) 2015-06-29 2020-12-01 EMC IP Holding Company LLC Backing up volumes using fragment files
US10496538B2 (en) * 2015-06-30 2019-12-03 Veritas Technologies Llc System, method and mechanism to efficiently coordinate cache sharing between cluster nodes operating on the same regions of a file or the file system blocks shared among multiple files
US10360236B2 (en) * 2015-09-25 2019-07-23 International Business Machines Corporation Replicating structured query language (SQL) in a heterogeneous replication environment
US10320703B2 (en) 2015-09-30 2019-06-11 Veritas Technologies Llc Preventing data corruption due to pre-existing split brain
US9684576B1 (en) 2015-12-21 2017-06-20 EMC IP Holding Company LLC Replication using a virtual distributed volume
US10235196B1 (en) 2015-12-28 2019-03-19 EMC IP Holding Company LLC Virtual machine joining or separating
US10133874B1 (en) 2015-12-28 2018-11-20 EMC IP Holding Company LLC Performing snapshot replication on a storage system not configured to support snapshot replication
US10067837B1 (en) 2015-12-28 2018-09-04 EMC IP Holding Company LLC Continuous data protection with cloud resources
US10152267B1 (en) 2016-03-30 2018-12-11 Emc Corporation Replication data pull
US10579282B1 (en) 2016-03-30 2020-03-03 EMC IP Holding Company LLC Distributed copy in multi-copy replication where offset and size of I/O requests to replication site is half offset and size of I/O request to production volume
US10235087B1 (en) 2016-03-30 2019-03-19 EMC IP Holding Company LLC Distributing journal data over multiple journals
US10235060B1 (en) 2016-04-14 2019-03-19 EMC IP Holding Company, LLC Multilevel snapshot replication for hot and cold regions of a storage system
CN106055417B (zh) * 2016-06-02 2018-09-11 北京百度网讯科技有限公司 用于机器人操作系统的消息传输方法和装置
US10019194B1 (en) 2016-09-23 2018-07-10 EMC IP Holding Company LLC Eventually consistent synchronous data replication in a storage system
US10146961B1 (en) 2016-09-23 2018-12-04 EMC IP Holding Company LLC Encrypting replication journals in a storage system
US10666569B1 (en) * 2016-09-23 2020-05-26 Amazon Technologies, Inc. Journal service with named clients
US10235091B1 (en) 2016-09-23 2019-03-19 EMC IP Holding Company LLC Full sweep disk synchronization in a storage system
US10210073B1 (en) 2016-09-23 2019-02-19 EMC IP Holding Company, LLC Real time debugging of production replicated data with data obfuscation in a storage system
US10346366B1 (en) 2016-09-23 2019-07-09 Amazon Technologies, Inc. Management of a data processing pipeline
US10805238B1 (en) 2016-09-23 2020-10-13 Amazon Technologies, Inc. Management of alternative resources
US10423459B1 (en) 2016-09-23 2019-09-24 Amazon Technologies, Inc. Resource manager
US10235090B1 (en) 2016-09-23 2019-03-19 EMC IP Holding Company LLC Validating replication copy consistency using a hash function in a storage system
US10725915B1 (en) 2017-03-31 2020-07-28 Veritas Technologies Llc Methods and systems for maintaining cache coherency between caches of nodes in a clustered environment
US10459810B2 (en) 2017-07-06 2019-10-29 Oracle International Corporation Technique for higher availability in a multi-node system using replicated lock information to determine a set of data blocks for recovery
US11144493B1 (en) 2018-05-02 2021-10-12 Ecosense Lighting Inc. Composite interface circuit
CN109376014B (zh) * 2018-10-19 2021-07-02 郑州云海信息技术有限公司 一种分布式锁管理器实现方法和系统
US11880350B2 (en) * 2021-06-08 2024-01-23 International Business Machines Corporation Identifying resource lock ownership across a clustered computing environment

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953719A (en) * 1997-09-15 1999-09-14 International Business Machines Corporation Heterogeneous database system with dynamic commit procedure control
US6226717B1 (en) * 1999-02-04 2001-05-01 Compaq Computer Corporation System and method for exclusive access to shared storage
US6256740B1 (en) * 1998-02-06 2001-07-03 Ncr Corporation Name service for multinode system segmented into I/O and compute nodes, generating guid at I/O node and exporting guid to compute nodes via interconnect fabric
US6272491B1 (en) * 1998-08-24 2001-08-07 Oracle Corporation Method and system for mastering locks in a multiple server database system

Family Cites Families (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0833857B2 (ja) * 1987-02-18 1996-03-29 株式会社日立製作所 システム間デ−タベ−ス共用システムジヤ−ナルマ−ジ方式
JP2667039B2 (ja) 1990-05-18 1997-10-22 株式会社東芝 データ管理システムおよびデータ管理方法
JPH0827755B2 (ja) * 1991-02-15 1996-03-21 インターナショナル・ビジネス・マシーンズ・コーポレイション データの単位を高速度でアクセスする方法
US5276872A (en) 1991-06-25 1994-01-04 Digital Equipment Corporation Concurrency and recovery for index trees with nodal updates using multiple atomic actions by which the trees integrity is preserved during undesired system interruptions
US5438464A (en) * 1993-04-23 1995-08-01 Quantum Corporation Synchronization of multiple disk drive spindles
JP3023441B2 (ja) * 1993-11-16 2000-03-21 株式会社日立製作所 データベース分割管理方法および並列データベースシステム
DE4341877A1 (de) * 1993-12-08 1995-06-14 Siemens Ag Verfahren zur Koordination von Zugriffen mehrerer Prozesse auf eine gemeinsame Ressource
US5454108A (en) * 1994-01-26 1995-09-26 International Business Machines Corporation Distributed lock manager using a passive, state-full control-server
US5751992A (en) 1994-09-23 1998-05-12 International Business Machines Corporation Computer program product for continuous destaging of changed data from a shared cache in a multisystem shared disk environment wherein castout interest is established in a hierarchical fashion
JP3516362B2 (ja) * 1995-03-01 2004-04-05 富士通株式会社 共有データ処理装置及び共有データ処理システム
US5699500A (en) * 1995-06-01 1997-12-16 Ncr Corporation Reliable datagram service provider for fast messaging in a clustered environment
US5594863A (en) * 1995-06-26 1997-01-14 Novell, Inc. Method and apparatus for network file recovery
US6356740B1 (en) * 1995-06-30 2002-03-12 Hughes Electronics Corporation Method and system of frequency stabilization in a mobile satellite communication system
JPH09114721A (ja) 1995-10-19 1997-05-02 Nec Corp ローカルエリアネットワークにおける装置共有方法および装置共有システム
US5678026A (en) 1995-12-28 1997-10-14 Unisys Corporation Multi-processor data processing system with control for granting multiple storage locks in parallel and parallel lock priority and second level cache priority queues
US5850507A (en) * 1996-03-19 1998-12-15 Oracle Corporation Method and apparatus for improved transaction recovery
US6016505A (en) * 1996-04-30 2000-01-18 International Business Machines Corporation Program product to effect barrier synchronization in a distributed computing environment
US6026426A (en) 1996-04-30 2000-02-15 International Business Machines Corporation Application programming interface unifying multiple mechanisms
US5920872A (en) * 1996-06-25 1999-07-06 Oracle Corporation Resource management using resource domains
US6044367A (en) 1996-08-02 2000-03-28 Hewlett-Packard Company Distributed I/O store
US5875469A (en) * 1996-08-26 1999-02-23 International Business Machines Corporation Apparatus and method of snooping processors and look-aside caches
US5909540A (en) 1996-11-22 1999-06-01 Mangosoft Corporation System and method for providing highly available data storage using globally addressable memory
US6026474A (en) * 1996-11-22 2000-02-15 Mangosoft Corporation Shared client-side web caching using globally addressable memory
US5987506A (en) * 1996-11-22 1999-11-16 Mangosoft Corporation Remote access and geographically distributed computers in a globally addressable storage environment
US5974250A (en) * 1996-12-13 1999-10-26 Compaq Computer Corp. System and method for secure information transmission over a network
US6108757A (en) * 1997-02-28 2000-08-22 Lucent Technologies Inc. Method for locking a shared resource in multiprocessor system
US5913227A (en) * 1997-03-24 1999-06-15 Emc Corporation Agent-implemented locking mechanism
FR2762418B1 (fr) * 1997-04-17 1999-06-11 Alsthom Cge Alcatel Procede de gestion d'une memoire partagee
US6237001B1 (en) * 1997-04-23 2001-05-22 Oracle Corporation Managing access to data in a distributed database environment
US6021508A (en) * 1997-07-11 2000-02-01 International Business Machines Corporation Parallel file system and method for independent metadata loggin
US5960446A (en) 1997-07-11 1999-09-28 International Business Machines Corporation Parallel file system and method with allocation map
US6112281A (en) * 1997-10-07 2000-08-29 Oracle Corporation I/O forwarding in a cache coherent shared disk computer system
US6108654A (en) * 1997-10-31 2000-08-22 Oracle Corporation Method and system for locking resources in a computer system
US6009466A (en) 1997-10-31 1999-12-28 International Business Machines Corporation Network management system for enabling a user to configure a network of storage devices via a graphical user interface
JPH11143843A (ja) 1997-11-06 1999-05-28 Hitachi Ltd 複数ノード構成システムの稼働状態管理方法
US6199105B1 (en) * 1997-12-09 2001-03-06 Nec Corporation Recovery system for system coupling apparatuses, and recording medium recording recovery program
US6173293B1 (en) * 1998-03-13 2001-01-09 Digital Equipment Corporation Scalable distributed file system
US6163855A (en) * 1998-04-17 2000-12-19 Microsoft Corporation Method and system for replicated and consistent modifications in a server cluster
US6438582B1 (en) * 1998-07-21 2002-08-20 International Business Machines Corporation Method and system for efficiently coordinating commit processing in a parallel or distributed database system
US6154512A (en) * 1998-11-19 2000-11-28 Nortel Networks Corporation Digital phase lock loop with control for enabling and disabling synchronization
US6178519B1 (en) * 1998-12-10 2001-01-23 Mci Worldcom, Inc. Cluster-wide database system
US6757277B1 (en) * 1999-01-26 2004-06-29 Siemens Information And Communication Networks, Inc. System and method for coding algorithm policy adjustment in telephony-over-LAN networks
US6269410B1 (en) * 1999-02-12 2001-07-31 Hewlett-Packard Co Method and apparatus for using system traces to characterize workloads in a data storage system
US6725392B1 (en) * 1999-03-03 2004-04-20 Adaptec, Inc. Controller fault recovery system for a distributed file system
WO2000062502A2 (en) * 1999-04-12 2000-10-19 Rainfinity, Inc. Distributed server cluster for controlling network traffic
KR20010074733A (ko) * 1999-05-20 2001-08-09 황 이반 충슝 작업집단 서버 어레이를 실현하기 위한 방법 및 장치
US6421723B1 (en) 1999-06-11 2002-07-16 Dell Products L.P. Method and system for establishing a storage area network configuration
JP4057201B2 (ja) 1999-09-16 2008-03-05 富士通株式会社 異種計算機間高速データ交換方式およびエクステント抽出・変換プログラム記録媒体
US6598058B2 (en) * 1999-09-22 2003-07-22 International Business Machines Corporation Method and apparatus for cross-node sharing of cached dynamic SQL in a multiple relational database management system environment
US6865549B1 (en) * 1999-11-15 2005-03-08 Sun Microsystems, Inc. Method and apparatus for concurrency control in a policy-based management system
US6473819B1 (en) * 1999-12-17 2002-10-29 International Business Machines Corporation Scalable interruptible queue locks for shared-memory multiprocessor
US6618819B1 (en) * 1999-12-23 2003-09-09 Nortel Networks Limited Sparing system and method to accommodate equipment failures in critical systems
US6370625B1 (en) * 1999-12-29 2002-04-09 Intel Corporation Method and apparatus for lock synchronization in a microprocessor system
US7062648B2 (en) 2000-02-18 2006-06-13 Avamar Technologies, Inc. System and method for redundant array network storage
US6643748B1 (en) * 2000-04-20 2003-11-04 Microsoft Corporation Programmatic masking of storage units
US20030041138A1 (en) * 2000-05-02 2003-02-27 Sun Microsystems, Inc. Cluster membership monitor
US6530004B1 (en) * 2000-06-20 2003-03-04 International Business Machines Corporation Efficient fault-tolerant preservation of data integrity during dynamic RAID data migration
US7844513B2 (en) 2000-07-17 2010-11-30 Galactic Computing Corporation Bvi/Bc Method and system for operating a commissioned e-commerce service prover
WO2002015449A2 (en) 2000-08-17 2002-02-21 Broadcom Corporation Method and system for transmitting isochronous voice in a wireless network
US6665814B2 (en) * 2000-11-29 2003-12-16 International Business Machines Corporation Method and apparatus for providing serialization support for a computer system
US6976060B2 (en) * 2000-12-05 2005-12-13 Agami Sytems, Inc. Symmetric shared file storage system
US8219662B2 (en) 2000-12-06 2012-07-10 International Business Machines Corporation Redirecting data generated by network devices
US20040213239A1 (en) * 2000-12-15 2004-10-28 Lin Xinming A. Implementation of IP multicast on ATM network with EMCON links
US6804794B1 (en) * 2001-02-28 2004-10-12 Emc Corporation Error condition handling
US7130316B2 (en) 2001-04-11 2006-10-31 Ati Technologies, Inc. System for frame based audio synchronization and method thereof
US7107319B2 (en) * 2001-05-31 2006-09-12 Oracle Corporation Method and apparatus for reducing latency and message traffic during data and lock transfer in a multi-node system
US6708175B2 (en) * 2001-06-06 2004-03-16 International Business Machines Corporation Program support for disk fencing in a shared disk parallel file system across storage area network
US7240057B2 (en) * 2001-09-21 2007-07-03 Kingsbury Brent A System and method for implementing journaling in a multi-node environment
US6871268B2 (en) * 2002-03-07 2005-03-22 International Business Machines Corporation Methods and systems for distributed caching in presence of updates and in accordance with holding times
US6862666B2 (en) * 2002-05-16 2005-03-01 Sun Microsystems, Inc. Hardware assisted lease-based access to memory

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5953719A (en) * 1997-09-15 1999-09-14 International Business Machines Corporation Heterogeneous database system with dynamic commit procedure control
US6256740B1 (en) * 1998-02-06 2001-07-03 Ncr Corporation Name service for multinode system segmented into I/O and compute nodes, generating guid at I/O node and exporting guid to compute nodes via interconnect fabric
US6272491B1 (en) * 1998-08-24 2001-08-07 Oracle Corporation Method and system for mastering locks in a multiple server database system
US6226717B1 (en) * 1999-02-04 2001-05-01 Compaq Computer Corporation System and method for exclusive access to shared storage

Also Published As

Publication number Publication date
US7266722B2 (en) 2007-09-04
US7496646B2 (en) 2009-02-24
CA2461015A1 (en) 2003-04-03
US20040202013A1 (en) 2004-10-14
EP1428149B1 (en) 2012-11-07
WO2003027903A1 (en) 2003-04-03
WO2003025780A8 (en) 2004-04-01
EP1428151A1 (en) 2004-06-16
US7111197B2 (en) 2006-09-19
US20030065760A1 (en) 2003-04-03
JP2005504369A (ja) 2005-02-10
EP1428149A1 (en) 2004-06-16
US20070033436A1 (en) 2007-02-08
WO2003027853A1 (en) 2003-04-03
US7437386B2 (en) 2008-10-14
US7149853B2 (en) 2006-12-12
EP1428151A4 (en) 2007-08-01
WO2003025751A9 (en) 2004-05-06
EP1428149A4 (en) 2007-04-04
US7240057B2 (en) 2007-07-03
CA2460833C (en) 2013-02-26
US7467330B2 (en) 2008-12-16
US20050015640A1 (en) 2005-01-20
US20030065896A1 (en) 2003-04-03
WO2003025780A9 (en) 2004-03-04
CA2460833A1 (en) 2003-03-27
CN1589447A (zh) 2005-03-02
US20030065686A1 (en) 2003-04-03
JP2005534081A (ja) 2005-11-10
WO2003025780A1 (en) 2003-03-27
AU2002341784A1 (en) 2003-04-01
CN1589448A (zh) 2005-03-02
CN1320483C (zh) 2007-06-06
WO2003025801A1 (en) 2003-03-27
WO2003025751A1 (en) 2003-03-27
US20030079155A1 (en) 2003-04-24
US20030065672A1 (en) 2003-04-03
JP4249622B2 (ja) 2009-04-02

Similar Documents

Publication Publication Date Title
CN1302419C (zh) 用于具有共享存储器的多节点环境的系统和方法
US7647327B2 (en) Method and system for implementing storage strategies of a file autonomously of a user
RU2595482C2 (ru) Обеспечение прозрачной отработки отказа в файловой системе
CN1524222A (zh) 信息备份系统和方法
US9569480B2 (en) Method and system for stateful recovery and self-healing
US7406473B1 (en) Distributed file system using disk servers, lock servers and file servers
US6839752B1 (en) Group data sharing during membership change in clustered computer system
US7600146B2 (en) System and method for application monitoring and automatic disaster recovery for high-availability
US20030158933A1 (en) Failover clustering based on input/output processors
CN1645389A (zh) 用于实现高可用性系统的远程企业管理的系统和方法
US20080320113A1 (en) Highly Scalable and Highly Available Cluster System Management Scheme
JP2008517358A (ja) ストレージ管理を容易にするための装置、システム、および方法
CN1902595A (zh) 在复制环境中的协调的存储管理操作
JP2008210412A (ja) マルチノード分散データ処理システムにおいてリモート・アクセス可能なリソースを管理する方法
US20130332770A1 (en) Active/passive database management across clusters
CN1968292A (zh) 在存储阵列中分配网络地址的系统与方法
US20100153768A1 (en) Method and system for providing immunity to computers
WO2003025802A1 (en) A system and method for collaborative caching in a multinode system
CN1195270C (zh) 可重新启动的计算机数据库的信息处理
US8191084B1 (en) Techniques for supporting application operation
Lundin et al. Significant advances in Cray system architecture for diagnostics, availability, resiliency and health
CN1776632A (zh) 克服单元管理层服务器中故障的方法和计算机产品
JP2010122768A (ja) リポジトリ管理用プログラムおよびリポジトリ管理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: HEWLETT-PACKARD DEVELOPMENT COMPANY

Free format text: FORMER OWNER: PAN SERVO CO., LTD.

Effective date: 20080314

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20080314

Address after: Texas, USA

Patentee after: HEWLETT-PACKARD Co.

Address before: Oregon, USA

Patentee before: Pan Servo

C41 Transfer of patent application or patent right or utility model
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Texas, USA

Patentee after: Hewlett-Packard Co.,Ltd.

Address before: Texas, USA

Patentee before: Hewlett-Packard Co.

TR01 Transfer of patent right

Effective date of registration: 20170120

Address after: Texas, USA

Patentee after: HEWLETT-PACKARD DEVELOPMENT Co.,L.P.

Address before: Texas, USA

Patentee before: Hewlett-Packard Co.,Ltd.

Effective date of registration: 20170120

Address after: Texas, USA

Patentee after: HEWLETT PACKARD ENTERPRISE DEVELOPMENT L.P.

Address before: Texas, USA

Patentee before: HEWLETT-PACKARD DEVELOPMENT Co.,L.P.

TR01 Transfer of patent right

Effective date of registration: 20210603

Address after: Illinois, USA

Patentee after: Ot patent trusteeship Co.,Ltd.

Address before: Texas, USA

Patentee before: HEWLETT PACKARD ENTERPRISE DEVELOPMENT L.P.

TR01 Transfer of patent right
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20070228