CN100361072C

CN100361072C - 流水线处理一系列处理指令的方法和设备

Info

Publication number: CN100361072C
Application number: CNB2004100387646A
Authority: CN
Inventors: 延斯·维滕贝格; 蒂姆·尼格迈尔
Original assignee: Thomson Licensing SAS
Current assignee: Thomson Licensing SAS
Priority date: 2003-03-29
Filing date: 2004-03-29
Publication date: 2008-01-09
Anticipated expiration: 2024-03-29
Also published as: CN1534462A; EP1462934A1; KR20040085058A; JP2004342087A; US20050076189A1

Abstract

处理器指令流水线是精简指令集计算机(RISC)体系结构的典型特征。从寄存器堆中读出处理需要的操作数。在流水线处理中的写后读存取问题，能够通过采用具有寄存器堆每个地址单独入口的记分板来避免。一旦指令进入流水线，在这个特定指令的目的地址的地址设置标记。这个标记表明流水线内的指令需要将其结果写入相应的寄存器地址。因此，只要设置了标记所述结果就不可用。显然，指令处理之后，成功地将结果写到寄存器堆。根据本发明，不仅将单个标记而且将流水线级的编号以及各指令的类型存储在特定指令的相应记分板地址中，所述流水线级的编号当前携带着需要将其结果写入特定寄存器堆地址的指令。

Description

流水线处理一系列处理指令的方法和设备

技术领域

本发明涉及一种流水线处理一系列处理指令的方法和设备，特别是转送精简指令集计算机(RISC)体系结构逻辑的指令时间表和结果。

背景技术

处理器指令流水线，将单条指令的处理分成几个(次)级，并且减少每个级的复杂度，同时提高时钟速度，这是精简指令集计算机(RISC)体系结构的典型特征。这样的流水线具有每周期处理通过一条指令，但每条指令有几个或“n”个周期的延迟。这种情况导致与本发明相关的两个结论：A)如果连续指令流中的特定指令产生其需要作为它直接后继的一个或多个指令的操作数的结果，该后继指令的处理必须等待(即，不能进入流水线并因此使流水线级空闲)直到前一指令的处理在相应流水线级中产生结果为止。这种处理情况用写后读(RAW)流水线故障(hazard)表示。B)操作数一般从所谓的寄存器堆中读取。然而，处理结果产生之后，通常花费一或两个另外的周期或级，直到确实将这些结果存储在寄存器堆里为止。因为所有的处理单元必须在同一级中写回以确保精确中断，所以如果处理单元具有不同的等待时间(例如，加载操作通常能够比浮点操作处理的更快)，则结果的产生和寄存器堆存取之间的延迟增加。但是，一旦结果实际产生，通过旁路寄存器堆而从后继的流水线级直接读取结果也是有可能的。这种处理叫作“结果转送”。

RAW故障可以通过采用“记分板”来避免，所述记分板典型的特征是，每个上述寄存器堆的地址有独立的入口。一旦指令进入流水线，就在这个特定指令的目的地址(即，所述结果地址)的地址上设置标记。该标记表明流水线内的指令需要将其结果写入相应的寄存器地址。因此，只要设置了标记，所述结果就不可用。显然指令处理之后，成功地将结果写到寄存器堆中。任何随后的需要进入流水线的指令必须检查，用于它的源(即操作数)寄存器地址中的至少一个是否设置了标记。只要这些标记未清除，所述指令就不允许进入流水线。因此，在每个周期都必须访问记分板。

例如，John L.Hennessy，David A.Patterson：“ComputerArchitecture：A Quantitative Approach”，出版者MorganKaufmann，ISBN：1558605967，2002年5月15日第3版，其中对记分板的体系结构作了详细描述。

发明内容

已知的记分板解决方案的缺点是，它们采用转送和指令表逻辑的较昂贵和通信密集的低速实现。为了实现针对想要进入流水线的每个指令的转送，必须检查每个操作数，看操作数地址是否作为目的寄存器出现在结果产生之后的流水线级之一中。尤其是，在以不同延迟为特征的处理单元的情况下，相当多的流水线级携带有适于转送的结果。公知的转送操作需要与所有的流水线级进行并行通信。

根据本发明，不仅是流水线级的单个标记(single flag)而且编号，或相应的代码字，通常都携带有需要将其结果(或操作数)写入特定寄存器堆地址的指令，并且各自的指令(或操作数，借此这种类型可以是二进制编码代码字)类型存储在位于特定指令(或操作数)的目的地址(即结果地址)的地址的相应记分板或寄存器堆地址中。一方面，这个特征需要记分板中的稍多一些的存储空间，但是另一方面，它简化了RAW故障检测，尤其是指令转送。

换句话说，虽然公知的记分板体系结构采用单个位，来标记特定目的寄存器地址被用于指令流水线中当前处理的指令，但本发明使用更为复杂的数据项，用来标明各指令的当前流水线级编号及类型。有利地，这个特定信息项能够用来计算所需的停止循环数，以防止从其可以转送结果的RAW故障和/或流水线级(或操作数)。

否则，需要监控用于转送的所有流水线级的结果(或操作数)，并且在每个周期，问题逻辑都需要访问记分板以检测各标记是否被设置。这些目的所需的逻辑和配线是昂贵的，且处理速度慢。本发明所解决的问题有利于在流水线处理中提高处理速度。

有利地，省略了RISC体系结构中用于结果转送的昂贵且可能低速的总线探测逻辑。写后读(RAW)流水线故障检测的效率也就提高了。

原则上，本发明的方法适用于流水线处理一系列处理指令，包括以下步骤：

一处理一系列连续的流水线级中的所述指令，其中，将部分或中间的第一流水线处理操作数或结果暂时地(intermediately)或永久地存储在操作数/结果存储器中，以在适当的时刻通过一个或多个所述流水线级进一步进行存取，

从而在适当的时刻，通过一个或多个其它所述流水线级，存取在一个或多个所述流水线级中当前可用的部分或中间的第二流水线处理操作数或结果，而不对所述操作数/结果存储器进行存取，以及

从而在记分板中存储信息，该信息关于后续的流水线处理所需的特定的所述部分或中间第一流水线处理操作数或结果存在或不存在，其中在所述记分板中，存储并更新数据，所述数据关于当前需要的操作数或结果处于哪个或哪些流水线级中，可用于一个或多个其它的所述流水线级，以及在所述记分板中，存储并更新关于指令类型的数据，所述指令涉及所述当前所需的操作数或结果，

所述的一个或多个其它的流水线级利用存储在所述记分板中的所述数据，以直接存取其它流水线级中可用的所述当前所需的操作数或结果，而不对存储在所述操作数/结果存储器中的数据进行存取。

原则上，本发明的设备适用于流水线处理一系列的处理指令，且包括：

—操作数/结果存储器；

—一系列连续的流水线级，处理所述指令，从而所述操作数/结果存储器暂时地或永久地存储部分或中间的第一流水线级处理操作数或结果，以在适当的时刻通过一个或多个所述流水线级进一步进行存取，以及

其中所述装置在适当的时刻，存取在一个或多个所述流水线级中当前可用的部分或中间的第二流水线处理操作数或结果，并将其提供给一个或多个其它的流水线级，而不对所述操作数/结果存储器进行存取；

—记分板，用于存储更新后的数据，所述数据关于当前需要的操作数或结果处于哪个或哪些流水线级，可用于一个或多个其它的流水线级，

所述记分板还存储更新后的关于指令类型的数据，所述指令涉及所述当前所需的操作数或结果，以及

其中，在所述装置中，所述的一个或多个其它的流水线级根据存储在所述记分板中的所述数据，直接存取其它流水线级中可用的所述当前所需的操作数或结果，而不对存储在所述操作数/结果存储器中的数据进行存取。

附图说明

参考附图，对本发明的具体实施例进行说明，图示为：

图1寄存器堆/流水线/记分板设置；

图2图1寄存器堆/流水线级/记分板设置中的尺寸为n的示例记分板。

具体实施方式

在图1中，(顺序)指令流进入一系列的n个流水线处理级STG0至STGN-1的第一级STG0。这些级每个均包括如一系列寄存器和适当的处理装置，其执行在CPU或微处理器中执行的典型的计算或操作。例如，级STG3到STGn-2能够转送中间或部分结果给转送总线FWDB，或给多路转送总线。但是，根据本申请，级STG2和/或STG1可以，或另外的接下来的级STG4，STG5，…，也可以不转送中间或部分结果给FWDB总线。级STG0至STGn-2能够转送中间流水线处理结果给相应的后续级，以作进一步处理。第一级STG0能够从总线FWDB和/或从寄存器堆REGF中读取中间或部分结果。最后级STGn-1将最终结果写入到寄存器堆REGF中，并且最终写入总线FWDB。STG0级将上述流水线级的代表编号和上述指令类型的代表编号写入记分板SCB。从级STG3-STGNn-1到FWDB总线的FWDB总线输出的转送由各级输出控制信号STG30C到STGN-10C控制，而所述的级输出控制信号由记分板SCB提供。由于流水线处理的一般原则，所以对于级STG1和STG2转送任何中间或部分结果到总线FWDB，通常不作检测。但是，根据本申请，如上所述，级STG2，STG1，STG4，STG5，…，的任何一个级，可以额外地伴随有或可以不伴随有各级输出控制信号STG20C，STG10C，STC40C，STG50C，…。

图2更详细地示出了记分板SCB可能的操作。将级STG0的输出信号ISTG0提供给控制级CTRL。这个控制级STRL提供复位信号Res给一系列的级计数寄存器STGCR0至STGCRM-1。通常M不等于N。级CTRL也提供由如位A至D组成的类型编码信号给一系列的指令类型寄存器ITR0至ITRM-1。寄存器STGCR0至STGCRM-1和ITR0至ITRM-1进一步由系统或周期时钟CLK以及来自CTRL的使能信号ENB控制。将寄存器STGCR0至STGCRM-1和寄存器ITR0至ITRM-1的输出信号提供给控制级CTRL。

例如，只要指令进入流水线(流水线级STG0)，记分板SCB的目的寄存器地址上就写入值“0”。如果流水线级没有停止，如由于RAW故障，则每一个新的周期，涉及先前已经进入第一流水线级的指令的目的寄存器地址的所有级计数器入口就会增加。因此，当前级编号一直不断地更新。当相应的指令离开流水线(流水线级STGn-1)时，计数器增加到值“n”。入口值“n”不增加。

换句话说，当前流水线级计数编号不断更新，且一旦处理过的处理指令离开流水线级系列中的最后的流水线级STGNn-1，流水线级计数编号就被设定不再增加的最终值。

这种处理能够通过在用于每个寄存器地址的CTRL中采用单独的增量器来执行。控制级STRL提供与图1有关的上述控制信号STG30C至STGN-10C。

将x作为产生结果的流水线级的最后编号，将取决于指令类型的编号存储在记分板SCB中。

将y作为要进入流水线的指令的操作数地址的记分板入口。然后，仅仅从x中减去y，就能容易地计算出必需的停止循环次数。如果结果小于或等于“0”，则不需要停止循环。如果y不等于n，则必须转送。实际转送结果的流水线级通过y直接指向信号，即信号OCSTGy。

因此，没有与单独流水线级的通信需要转送。记分板SCB仅通过级STG0存取。所有通信保留在本地，其节约了全程配线(在现代亚μ硅技术中这样的配线使处理较慢)。也节约了可能昂贵且低速的通信逻辑。

例如，SPARC V8 RISC处理器能够用来实现本发明，借此，浮点单元的内部接口能够根据本发明重新设计，以得到更好的性能。浮点流水线能够具有八个级的长度，其中浮点操作能够在第6级产生它们的结果，并且在第2级载入操作就已发生。因此，特殊地，载入指令需要广泛的转送。该实现已经通过使用VHDL在寄存器转移级上的模拟，以及通过FPGA板上的快速样机研究实现得到了全面的证实。

优选地，电子和/或自动地执行本发明的流水线处理。

代替硬件，本发明也能够通过采用相应的软件来实现。

Claims

1、一种用于流水线处理一系列处理指令(SIS)的方法，包括以下步骤：

-处理一系列连续的流水线级(STGO-STGn-1)中的所述指令(SIS)，其中，将部分或中间的第一流水线级处理操作数或结果暂时地或永久地存储在操作数/结果存储器(REGF)中，以在适当的时刻通过一个或多个所述流水线级(STGO-STGn-1)进一步进行存取，

从而在适当的时刻，通过一个或多个其它的流水线级，存取在一个或多个流水线级中当前可用的部分或中间的第二流水线处理操作数或结果，而不对所述操作数/结果存储器(REGF)进行存取，以及

从而在记分板(SCB)中存储信息，该信息关于后续的流水线处理所需的特定部分或中间的第一流水线级操作数或结果存在或不存在，

其特征在于：

-在所述记分板(SCB)中，存储并更新数据，所述数据关于当前所需的操作数或结果处于哪个或哪些流水线级中，可用于一个或多个其它的流水线级，以及在所述记分板(SCB)中，存储并更新关于指令类型的数据，所述指令涉及所述当前所需的操作数或结果，

2、如权利要求1所述的方法，其特征在于所述记分板(SCB)包含单独的增量器，用于所述操作数/结果存储器中的寄存器的每个地址。

3、如权利要求2所述的方法，其特征在于，

一旦处理指令进入所述第一流水线级(STGO)，第一流水线级(STGO)在所述记分板(SCB)中的目的寄存器的地址上写入零值，并且，如果相应的流水线没有停止，每个新的周期所有级的计数器将加1，所述级计数器涉及先前进入第一流水线级的处理指令，这样当前流水线级计数值不断更新，并且，一旦处理过的处理指令离开所述系列流水线级的最后流水线级(STGn-1)，所述流水线级计数值就会被设置为不再增加的最终值(n)。

4、如权利要求1至3之一所述的方法，其特征在于，

所述流水线级系列，除了第一(STGO)和最后(STGn-1)流水线级，将在一个或多个所述流水线级中可用的部分或中间的第二流水线处理操作数或结果提供给公共总线(FWDB)，在适当的时刻，通过一个或多个其它的所述流水线级，从所述公共总线(FWDB)存取部分或中间的第二流水线处理操作数或结果，而不对所述操作数/结果存储器(REGF)进行存取。

5、一种流水线处理一系列处理指令(SIS)的装置，包括：

-操作数/结果存储器(REGF)；

-一系列连续的流水线级(STGO-STGn-1)，处理所述指令(SIS)，从而所述操作数/结果存储器(REGF)暂时地或永久地存储部分或中间的第一流水线级处理操作数或结果，以在适当的时刻通过一个或多个所述流水线级(STGO-STGn-1)进一步进行存取，以及

其中，所述装置在适当的时刻，存取在一个或多个所述流水线级中当前可用的部分或中间的第二流水线处理操作数或结果，并将其提供给一个或多个其它的流水线级，而不对所述操作数/结果存储器(REGF)进行存取；

-记分板(SCB)，用于存储更新后的数据，所述数据关于当前需要的操作数或结果处于哪个或哪些流水线级中，可用于一个或多个其它的流水线级，

6、如权利要求5所述的装置，其特征在于所述记分板(SCB)包含单独的增量器，用于所述操作数/结果存储器中的寄存器的每个地址。

7、如权利要求6所述的装置，其特征在于，

8、如权利要求5至7之一所述的装置，其特征在于，