DE60109748T2

DE60109748T2 - Verfahren und gerät zur ausführungsunterbrechung in einem prozessor

Info

Publication number: DE60109748T2
Application number: DE60109748T
Authority: DE
Inventors: T. Deborah MARR; Dion Rodgers
Original assignee: Intel Corp
Current assignee: Intel Corp
Priority date: 2000-01-21
Filing date: 2001-01-17
Publication date: 2006-02-09
Anticipated expiration: 2021-01-18
Also published as: AU2001229506A1; CN102346689B; EP1522917A3; US7451296B2; WO2001053935A1; CN102346689A; EP1256054B1; CN1426553B; RU2002122402A; CN1426553A; RU2271035C2; EP1522917A2; US6671795B1; US20040117604A1; EP1522917B1; DE60109748D1; EP1256054A1; DE60143230D1

Description

Gebiet der Erfindung
Die vorliegende Erfindung betrifft ein Verfahren und eine Einrichtung zum Aussetzen einer Ausführung in einem Prozessor oder dergleichen. Insbesondere betrifft ein Ausführungsbeispiel der vorliegenden Erfindung die Steuerung des Aussetzens der Ausführung eines einer Mehrzahl von Threads [eigenständige Prozessaktivitäten], um so einem anderen der Threads den Vorrang zu geben oder um Energie zu sparen.
Hintergrund der Erfindung
Wie auf dem Gebiet bekannt ist, umfasst ein Prozessor verschiedene Untermodule, von denen jedes zur Ausführung spezieller Aufgaben angepasst ist. In einem bekannten Prozessor umfassen diese Untermodule Folgendes: einen Befehls-Cache, eine Befehlsabrufeinheit zum Abrufen der entsprechenden Befehle aus dem Befehls-Cache; eine Decodierlogik, die den Befehl in ein End- oder Zwischenformat decodiert, eine Mikro-Operationslogik, die Zwischenbefehle für eine Ausführung in ein Endformat konvertiert; und eine Ausführungseinheit, die Endformatbefehle ausführt (entweder in einigen Beispielen von der Decodierlogik oder in anderen von der Mikro-Operationslogik).
Im Betrieb mit einem Taktgeber führt die Ausführungseinheit des Prozessorsystems an sie übergebene, aufeinander folgende Befehle aus. Wie auf dem Gebiet bekannt ist, kann der Ausführungseinheit ein Befehl bereitgestellt werden, der zu keiner signifikanten Aufgabendurchführung des Prozessorsystems führt. Zum Beispiel veranlasst in den Intel^® X86-Prozessorsystemen ein NOP (Nulloperations)-Befehl die Ausführungseinheit, für einen „Befehlszyklus" nicht aktiv zu werden. Ein Befehlszyklus, wie er hier verwendet wird, ist eine festgesetzte Anzahl von Prozessortaktzyklen, die vom Prozessor zur Ausführung eines Befehls benötigt werden. Tatsächlich blockiert der NOP-Befehl den Prozessor für einen Befehlszyklus.
Eine Beschränkung des NOP-Befehls besteht darin, dass er den Prozessor für eine festgesetzte Zeiteinheit blockiert. Folglich kann der Prozessor unter Verwendung eines oder mehrerer NOP-Befehle nur für eine Zeit gleich dem ganzzahligen Vielfachen der Befehlszyklen blockiert werden.
Eine weitere Beschränkung des NOP-Befehls besteht darin, dass die Ausführungseinheit des Prozessors nicht zur Durchführung irgendeiner anderen Befehlsausführung imstande ist. Zum Beispiel können von der Ausführungseinheit auszuführende Befehle in zwei oder mehr „Threads" aufgeteilt sein. Jeder Thread ist ein Satz von Befehlen zum Erfüllen einer vorgegebenen Aufgabe. Wenn einer der Threads einen NOP-Befehl umfasst, wird folglich dieser Befehl durch die Ausführungseinheit ausgeführt und der gesamte Prozessor blockiert (d.h. die Ausführung des anderen Threads kann während der Ausführung des NOP-Befehls nicht vorgenommen werden).
Auf dem Gebiet sind Prozessoren mit paralleler Thread-Bearbeitung bekannt. Zum Beispiel offenbart die europäische Veröffentlichung Nr. 0 827 071 (MATSUSHITA ELECTRIC INDUSTRIAL CO. LTD) ein Beispiel eines derartigen Prozessors. Im MATSUSHITA-Prozessor werden für jeden Thread Decodiereinheiten bereitgestellt und eine Mehrzahl von Funktionseinheiten wird zur Ausführung der in jedem Thread enthaltenen Befehle bereitgestellt. Eine Steuereinheit umfasst eine Entscheidungseinheit, die auswählt, welche Befehle von welchem Thread auszuführen sind. Die Steuereinheit umfasst außerdem eine Unterbrechungseinheit zum Unterbrechen der Ausführung eines Befehlsstroms. Die Steuereinheit unterbricht die Ausführung von Befehlen eines Threads, wenn ein „Stopp"-Befehl von einer Funktionseinheit ausgeführt wird. Die Versorgung mit Befehlen zur Ausführung wird durch einen externen Interrupt zu einem, dem gestoppten Thread zugeordneten, logischen Prozessor neu gestartet. In den Ausführungsbeispielen der vorliegenden Erfindung gibt es eine Ermittlung, ob der nächste Befehl für einen Thread von einer ersten Art ist (z.B. ein SET-Befehl). Das Vorliegen dieser Befehlsart kann sehr viel früher als im MATSUSHITA-Prozessor (z.B. durch die Decodiereinheit) erfasst werden, um ein Flag zur Verhinderung der Weiterleitung weiterer Befehle vom festgelegten Thread durch die Pipeline zu setzen. Wenn in einem Ausführungsbeispiel der vorliegenden Erfindung eine erste Befehlsart durch die Ausführungseinheit ausgeführt wird, wird das Flag zur Bewilligung der Verarbeitung von Befehlen des vorher ausgesetzten Threads gelöscht (ohne dass die Erzeugung eines Interrupts erforderlich ist).
In Anbetracht des Obenerwähnten wird ein verbessertes Verfahren und eine verbesserte Einrichtung zum Aussetzen der Prozessorausführung benötigt, die diese Beschränkungen vermeiden.
Zusammenfassung der Erfindung
Gemäß einem Ausführungsbeispiel der vorliegenden Erfindung wird ein Verfahren zum Aussetzen der Ausführung von Befehlen in einem Thread dargelegt. Zuerst wird ermittelt, ob der nächste Befehl für einen ersten Thread ein Befehl einer ersten Art ist. Wenn er es ist, wird der Befehl des ersten Thread an der Verarbeitung zur Ausführung gehindert, während ein Befehl von einem zweiten Thread zur Ausführung verarbeitet werden kann.
Kurzbeschreibung der Zeichnungen
1 ist ein Blockdiagramm eines Teils eines Prozessors, der ein Ausführungsbeispiel der vorliegenden Erfindung anwendet.
2 ist ein Ablaufdiagramm, das ein Ausführungsbeispiel eines Verfahrens gemäß einem Ausführungsbeispiel der vorliegenden Erfindung zeigt.
3 ist ein Blockdiagramm eines Teils eines Prozessors, der ein zusätzliches Ausführungsbeispiel der vorliegenden Erfindung anwendet.
4 ist ein Ablaufdiagramm, das ein zusätzliches Ausführungsbeispiel eines Verfahrens gemäß einem Ausführungsbeispiel der vorliegenden Erfindung zeigt.
Detaillierte Beschreibung
Es wird auf 1 Bezug genommen, in der ein Beispiel eines Teils eines Prozessorsystems 10 gezeigt ist, das ein Ausführungsbeispiel der vorliegenden Erfindung implementiert. In diesem Ausführungsbeispiel ist der Prozessor ein mehrfädiger (multithreaded) Prozessor, in dem theoretisch die Ausführung in zwei oder mehr logische Prozessoren aufgeteilt wird. Der Begriff „Thread", wie er hier verwendet wird, bezieht sich auf eine Befehlscodefolge. Zum Beispiel kann der Prozessor in einer Videotelefonanwendung zur Ausführung von Code zur Behandlung von Videobilddaten wie auch von Audiodaten aufgerufen werden. Es kann separate Codefolgen geben, deren Ausführung zur Behandlung jedes dieser Datentypen ausgelegt ist. Folglich kann ein erster Thread Befehle zur Videobilddatenverarbeitung umfassen und ein zweiter Thread kann aus Befehlen zur Audiodatenverarbeitung bestehen. In diesem Beispiel gibt es eine einzige Ausführungseinheit (Out-of-Order [Neuordnung: Sortierung der Abarbeitungsreihenfolge während der Laufzeit] – Ausführungs-Einheit 31), die einen Befehl zu einem Zeitpunkt ausführen kann. Das Prozessorsystem 10 kann jedoch als zwei logische Prozessoren betrachtet werden, ein Befehle vom ersten Thread (Thread 0) ausführender, erster logischer Prozessor und ein Befehle vom zweiten Thread (Thread 1) ausführender, zweiter logischer Prozessor.
In diesem Ausführungsbeispiel des Prozessorsystems 10 werden Befehle durch eine Abrufeinheit 11 abgerufen, zu einer Warteschlange 13 geliefert und als Teil der Warteschlange des Thread 0 oder der Warteschlange des Thread 1 gespeichert. Ein Fachmann wird verstehen, dass die im Prozessorsystem 10 verwendeten Warteschlangen zur Speicherung von mehr als zwei Threads verwendet werden können. Die Befehle beider Threads werden zu einem Multiplexer (MUX) 15 geliefert. Eine Steuerlogik 17 wird zur Steuerung verwendet, ob die Befehle von Thread 0 oder Thread 1 zu einer Decodiereinheit 21 geliefert werden. Die Decodiereinheit 21 kann einen Befehl in zwei oder mehr Mikrobefehle konvertieren und liefert die Befehle an die Warteschlange 23. Die Ausgaben der Warteschlange 23 werden zu einem MUX geliefert, der basierend auf dem Betrieb der Steuerlogik 26 die Befehle von Thread 0 oder Thread 1 zu einer Umbenennungs-/Zuweisungseinheit 27 liefert. Die Umbenennungs-/Zuweisungseinheit 27 liefert die Befehle ihrerseits an die Warteschlange 28. MUX 29 wählt basierend auf dem Betrieb der Ablaufplansteuerlogik 30, die ebenfalls die gleichen Eingaben wie MUX 29 empfängt, zwischen der Warteschlange des Thread 0 und der Warteschlange des Thread 1 aus. Die Ausgabe des MUX 29 wird an eine Ausführungseinheit 31 geliefert, die den Befehl ausführt. Die Befehle werden dann in der Warteschlange 33 angeordnet. Die Ausgaben der Warteschlange 33 werden zu einem MUX 34 geliefert, der basierend auf dem Betrieb der Steuerlogik 35 einen Befehl von Thread 0 und Thread 1 zu einer Retire- bzw. Festschreibungs-Einheit 36 sendet.
Gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung wird ein Aussetzungsbefehl zum vorübergehenden Aussetzen der Verarbeitung von Befehlen eines Thread verwendet. In 1 wird der Aussetzungsbefehl durch die Abrufeinheit 11 abgerufen und in diesem Beispiel in der Warteschlange des Threads 0 gespeichert. Die Ausgabe der Warteschlange des Threads 0 wird über MUX 15 an eine Decodiereinheit 21 geliefert, die den Aussetzungsbefehl in zwei Mikrobefehle Decodiert: einen SET-Befehl und einen READ-Befehl. An der Decodiereinheit 21 veranlasst ein SET-Befehl die Speicherung eines Wertes im Speicher (z.B. einem Bit-Flag 19), um anzuzeigen, dass für einen bestimmten Thread (in diesem Beispiel Thread 0) ein SET-Befehl empfangen wurde. Der SET-Befehl wird dann in die „Pipeline" eingespeist, die in diesem Ausführungsbeispiel die Umbenennungs-/Zuweisungseinheit 27 und die Ausführungseinheit 31 und die zugeordneten Warteschlangen umfasst. Die Ausführungseinheit 31 wird beim SET-Befehl nicht aktiv (d.h., sie behandelt ihn wie den bekannten NOP-Befehl). Sobald der SET-Befehl durch die Retire-Einheit 26 festgeschrieben ist, wird das Flag 19 zurückgesetzt.
Der READ-Befehl an der Decodiereinheit 21 wird solange nicht in der Pipeline angeordnet, bis das Flag 19 zurückgesetzt ist. Wenn Befehle vom Thread 1 in der Warteschlange 13 vorliegen, können diese Befehle dementsprechend durch die Decodiereinheit 21 decodiert und in der Pipeline angeordnet werden. Folglich wird in Abhängigkeit von der Anzahl der Befehle des Threads 1 in den Warteschlangen 23, 28 und 33 beeinflusst, wie lange die Ausführung von Thread 0 ausgesetzt wird (d.h. je größer die Anzahl der Befehle des Threads 1 in der Pipeline ist, desto länger wird der SET-Befehl benötigen, um die Retire-Einheit 36 zu erreichen). Sobald das Flag 19 zurückgesetzt ist, wird der READ-Befehl zur Warteschlange 23 und schließlich zur Ausführungseinheit 31 gesendet. Wie beim SET-Befehl wird die Ausführungseinheit wie bei einem NOP-Befehl nicht aktiv. In diesem Ausführungsbeispiel der vorliegenden Erfindung decodiert die Decodiereinheit 21 abwechselnd die Befehle von Thread 0 und Thread 1. Nach zum Beispiel einem SET-Befehl für den Thread 0 wechselt die Decodierung zwischen der Decodierung von Befehlen von Thread 1 und der Prüfung des Wertes von Flag 19, bis es zurückgesetzt wird.
Ein Beispiel des Betriebs der Decodiereinheit 21 gemäß diesem Ausführungsbeispiel ist in 2 gezeigt. Nach der Decodierung wird in Block 40 der Befehl vom nächsten Thread ermittelt. Im Entscheidungsblock 41 wird ermittelt, ob der Befehl ein SET-Befehl ist. Wenn er es ist, geht die Steuerung zu Block 43 über, wo das Bit-Flag im Speicher gesetzt wird. Im Block 47 wird der SET-Befehl in der Pipeline für die Ausführungseinheit angeordnet. Die Steuerung kehrt dann zur Ermittlung des nächsten Befehls vom nächsten Thread zu Block 40 zurück. Wenn der Befehl kein SET-Befehl ist, geht die Steuerung zum Entscheidungsblock 45 über, um zu ermitteln, ob der Befehl ein READ-Befehl ist. Wenn er es ist, geht die Steuerung zum Entscheidungsblock 49 über, um zu ermitteln, ob das entsprechende Bit-Flag im Speicher gesetzt ist. Wenn das Bit-Flag im Speicher gesetzt ist, geht die Steuerung zum Block 51 über, wo der Befehl von der Pipeline zurückgehalten wird (folglich wird die Ausführung von Befehlen von diesem bestimmten Thread zeitweise blockiert). Die Steuerung verlagert sich dann zu Block 40, um den nächsten Befehl vom nächsten Thread zu ermitteln. Wenn das Bit-Flag nicht gesetzt ist (Entscheidungsblock 49), geht die Steuerung zu Block 53 über, wo der Befehl (in diesem Fall der READ-Befehl) in die Pipeline zur Ausführung angeordnet wird. Wie oben erwähnt, wird in diesem Ausführungsbeispiel das Bit-Flag zurückgesetzt, wenn der SET-Befehl festgeschrieben bzw. retired wird. Die Steuerung kehrt dann zu Block 40 zurück, um den nächsten Befehl vom nächsten Thread zu ermitteln. Ebenso wird er, wenn der Befehl weder ein SET-Befehl noch ein READ-Befehl ist, in der Pipeline zur Ausführung in einer normalen Art und Weise angeordnet.
Wie vom Obenerwähnten zu entnehmen ist, dient der SET-Befehl zur Bewirkung einer Aussetzung bzw. Pause in der Ausführung für diesen Thread, bis der Befehl festgeschrieben wird. Dies liegt daran, dass der nachfolgende READ-Befehl solange nicht in der Pipeline angeordnet wird, bis der SET-Befehl festgeschrieben ist, wobei die Ausführung der nachfolgenden Befehle von diesem Thread in wirksamer Weise blockiert wird. Während der Aussetzung eines Threads werden die Befehle von diesem Thread an der Verarbeitung zur Ausführung gehindert (z.B. Anordnung in der Pipeline, Senden zur Ausführungseinheit etc.), während Befehle von einem anderen Thread zur Ausführung verarbeitet werden können. Wenn die Ausführung eines Threads ausgesetzt ist, kann der Gesamtenergieverbrauch für das Verarbeitungssystem reduziert werden.
Gemäß einem weiteren Ausführungsbeispiel der vorliegenden Erfindung wird ein Aussetzungsbefehl mit einem Zeitgeber oder Zähler ausgeführt. Wie in 3 gezeigt, wird das Speicher-Flag 19 von 1 durch einen Zähler 39 ersetzt. Wenn als ein erstes Beispiel die Decodiereinheit 21 ermittelt, dass der nächste Befehl eines ersten Threads ein Aussetzungsbefehl ist (d.h. ein Befehl, der ein bestimmtes Bit-Format aufweist), wird ein vorgegebener Wert in den Zähler 39 geladen. In diesem Beispiel zählt der Zähler 39 vom vorgegebenen Wert zu Null zurück. Während der Zähler 39 zu Null zurückzählt, werden Befehle vom zweiten Thread (z.B. Thread 1) Decodiert und in die Pipeline geladen. In diesem Beispiel wechselt die Decodiereinheit 21 zwischen der Prüfung des wertes des Zählers 39 (anstelle der Decodierung von Befehlen von Thread 0) und der Decodierung von Befehlen vom Thread 1. Sobald der Zähler fertig ist (z.B. Null erreichte), kann der nächste Befehl von diesem Thread in die Pipeline geladen werden. Als ein zweites Beispiel wird der Aussetzungsbefehl einen Operanden umfassen (d.h. ein in den Zeitgeber zu ladender Wert). Dementsprechend gestattet dies der Decodiereinheit 21, den Operandenwert in den Zähler 39 zu laden, so dass die Zeitdauer des Aussetzungsbefehls gesetzt werden kann.
Ein Beispiel des Betriebs des Verarbeitungssystems von 3 ist in 4 gezeigt. Im Entscheidungsblock 60 wird ermittelt, ob der Zähler einen vorgegebenen Wert für den aktuellen Thread erreicht hat. Wenn kein Zähler gesetzt wurde oder der Wert den vorgegebene Wert (z.B. Null) erreicht hat, geht die Steuerung zur Ermittlung des nächsten Befehls für den aktuellen Thread auf Block 61 über. Wenn dieser Befehl ein Aussetzungsbefehl ist (Entscheidungsblock 63), geht die Steuerung zum Entscheidungsblock 65 über, um zu ermitteln, ob ein Operand dem Aussetzungsbefehl zugeordnet ist. Wenn ein Operand dem Aussetzungsbefehl zugeordnet ist, geht die Steuerung zum Block 67 über, um den Wert in den Zähler zu laden (die Steuerung geht dann zu Block 73 über, um zum nächsten Thread zu wechseln). Wenn kein Operand dem Aussetzungsbefehl zugeordnet ist, geht die Steuerung zu Block 71 über, um einen vorgegebenen Wert in den Zähler zu laden (erneut geht die Steuerung zu Block 73 über, um zum nächsten Thread zu wechseln). Wenn im Entscheidungsblock 63 der Befehl kein Aussetzungsbefehl ist, geht die Steuerung zu Block 69 über, um den Befehl in die Pipeline zu laden.
Gemäß einem Ausführungsbeispiel der vorliegenden Erfindung kann die Verwendung des Aussetzungsbefehls eine Angabe des Betriebssystems sein, dass die verarbeitende System-Hardware in einen Energiesparmodus gehen kann. Folglich kann die Ausführung von Betriebssystemcode (oder irgendeinem anderen Software-Code) am Prozessorsystem die Weiterleitung eines Aussetzungsbefehls zur Decodiereinheit bewirken. Wie oben erwähnt, kann die Aussetzung der Ausführung eines Threads zu einer Verringerung des Gesamtenergieverbrauchs führen. Als Reaktion auf die Decodierung eines Aussetzungsbefehls kann das Verarbei tungssystem 10 andere Schritte zu einer gewünschten weiteren Verringerung des Gesamtenergieverbrauchs unternehmen.

Claims

Ein Verfahren zum Aussetzen der Ausführung von Befehlen in einem Thread, umfassend: Bestimmen, ob ein erster Befehl für einen ersten Thread als Befehl einer ersten Art decodiert worden ist (40, 41); Verhindern, daß Befehle des ersten Threads zur Ausführung verarbeitet werden, für eine Zeitdauer (51), sofern der erste Befehl als einer der ersten Art decodiert worden ist (41), während Befehle aus einem zweiten Thread zur Ausführung verarbeitet werden können; und Wiederaufnehmen der Ausführung des ersten Threads in Abhängigkeit von dem ersten Befehl (53).
Das Verfahren nach Anspruch 1, ferner umfassend ein Decodieren des ersten Befehls in einen ersten Mikrobefehl und einen zweiten Mikrobefehl.
Das Verfahren nach Anspruch 2, wobei der erste Mikrobefehl bewirkt, daß ein Wert für den ersten Thread im Speicher gespeichert wird.
Das Verfahren nach Anspruch 3, ferner umfassend eine Verarbeitung des zweiten Mikrobefehls zur Ausführung, wenn der im Speicher gespeicherte Wert zurückgesetzt ist.
Das Verfahren nach Anspruch 4, wobei der im Speicher gespeicherte Wert zurückgesetzt wird, wenn der erste Mikrobefehl festgeschrieben (retired) wird.
Das Verfahren nach Anspruch 1, wobei der Befehl einer ersten Art ein Pause-Befehl ist, wobei das Verfahren ferner umfaßt: Empfangen des Pause-Befehls aus einem ersten Thread an einer Decodiereinheit (21) in einem Prozessor; und wobei das Wiederaufnehmen der Verarbeitung des ersten Threads zur Ausführung in Erwiderung des Pause-Befehls erfolgt.
Das Verfahren nach Anspruch 6, wobei die Ausführung von Software-Code bewirkt, daß der Pause-Befehl an der Decodiereinheit empfangen wird.
Das Verfahren nach Anspruch 1, ferner umfassend: Empfangen von Befehlen für einen ersten Thread (11); Decodieren eines ersten Befehls aus dem ersten Thread in einen zweiten Befehl und einen dritten Befehl (21); Setzen eines Flags, um das Vorhandensein des zweiten Befehls anzuzeigen (19, 41, 43); Senden des zweiten Befehls in eine Pipeline (47); Abhalten des dritten Befehls vom Eintreten in die Pipeline, wenn das Flag gesetzt ist, wobei das Verarbeiten des ersten Threads ausgesetzt wird (51); Ausführen des zweiten Befehls; Rücksetzen des Flags bei Festschreibung (retirement) des zweiten Befehls; und Freigeben des dritten Befehls in die Pipeline, nachdem das Flag zurückgesetzt worden ist, wobei die Verarbeitung des ersten Threads wieder aufgenommen wird (53).
Das Verfahren nach Anspruch 8, ferner umfassend: Freigeben von Verarbeitungsressourcen zum Verarbeiten eines zweiten Threads, während der erste Thread ausgesetzt (pausiert) ist; und Verarbeiten von Befehlen des zweiten Threads.
Das Verfahren nach Anspruch 1, ferner umfassend: Decodieren eines ersten Befehls aus einem ersten Thread in einen zweiten Befehl und einen dritten Befehl; Abhalten des dritten Befehls vom Eintreten in eine Befehlspipeline, bis der zweite Befehl festgeschrieben wird (retires) (51); Ausführen des zweiten Befehls (47); und Freigeben des dritten Befehls in die Befehlspipeline (53).
Das Verfahren nach Anspruch 10, ferner umfassend: Aussetzen der Verarbeitung von Befehlen aus dem ersten Thread nach dem ersten Befehl; Verarbeiten von Befehlen aus einem zweiten Thread, während der erste Thread ausgesetzt ist; und Wiederaufnehmen der Verarbeitung von Befehlen aus dem ersten Thread in Erwiderung der Festschreibung (retirement) des dritten Befehls.
Das Verfahren nach Anspruch 11, ferner umfassend: Setzen eines Flags in Erwiderung des zweiten Befehls; und Rücksetzen des Flags in Erwiderung der Festschreibung des zweiten Befehls.
Ein Verfahren, umfassend: Bestimmen, ob ein erster Befehl für einen ersten Thread als ein Befehl einer ersten Art decodiert worden ist (63); Initiieren eines Zählers (39); und Hindern von Befehlen des ersten Threads daran, zur Ausführung verarbeitet zu werden, bis der Zähler einen vorgegebenen Wert erreicht, während Befehle für einen zweiten Thread zur Ausführung verarbeitet werden (73, 60).
Das Verfahren nach Anspruch 13, ferner umfassend ein Wiederaufnehmen einer Verarbeitung für eine Ausführung von Befehlen des ersten Threads, nachdem der Zähler den vorgegebenen Wert erreicht.
Das Verfahren nach Anspruch 13, ferner umfassend: Laden eines Zählers (39) mit einem ersten Wert in Erwiderung des ersten Befehls des ersten Threads; Aussetzen einer Verarbeitung des ersten Threads, wobei Befehle nach dem ersten Befehl des ersten Threads nicht mehr in eine Pipeline eintreten, bis der Zähler bis zu einem vorgegebenen Wert zählt (73, 60); Verarbeiten eines zweiten Threads, während der erste Thread ausgesetzt ist (69); und Wiederaufnehmen der Verarbeitung des ersten Threads, nachdem der Zähler bis zu dem vorgegebenen Wert gezählt hat (60, 73).
Das Verfahren nach Anspruch 15, wobei der erste Wert einer vorgegebenen Zeitdauer entspricht.
Das Verfahren nach Anspruch 13 oder 15, wobei der erste Befehl einen Operanden enthält und wobei das Initiieren ein Laden des Zählers mit dem Operanden einschließt.
Eine Einrichtung mit einer Decodiereinheit zum Pausieren der Ausführung von Befehlen in einem Thread, gekennzeichnet dadurch: daß die Decodiereinheit bestimmt, ob ein erster Befehl eines ersten Threads ein Befehl einer ersten Art ist, wobei die Decodiereinheit dazu dient, Befehle des ersten Threads für eine Zeitdauer daran zu hindern, zur Ausführung verarbeitet zu werden, während Befehle aus einem zweiten Thread zur Ausführung verarbeitet werden können, wobei die Decodiereinheit ferner dazu dient, eine Wiederaufnahme der Verarbeitung von Befehlen des ersten Threads in Erwiderung des ersten Befehls zu bewirken.
Die Einrichtung nach Anspruch 18, wobei der erste Befehl einen ersten Mikrobefehl und einen zweiten Mikrobefehl umfaßt.
Die Einrichtung nach Anspruch 19, ferner aufweisend: einen Speicher, wobei der erste Mikrobefehl bewirkt, daß ein Wert im Speicher für den ersten Thread gespeichert wird.
Die Einrichtung nach Anspruch 20, wobei die Decodiereinheit den zweiten Mikrobefehl zur Ausführung verarbeitet, wenn der im Speicher gespeicherte Wert zurückgesetzt ist.
Die Einrichtung nach Anspruch 21, ferner aufweisend: eine mit der Decodiereinheit gekoppelte Festschreibeinheit (retire unit), wobei die Festsschreibeinheit bewirkt, daß der im Speicher gespeicherte Wert zurückgesetzt wird, wenn der erste Mikrobefehl von der Festschreibeinheit festgeschrieben (retired) wird.
Die Einrichtung nach Anspruch 18, wobei die Decodiereinheit Teil eines Prozessors (10) ist, um den Energieverbrauch zu reduzieren, und wobei die Decodiereinheit (21) dazu dient, den ersten Befehl aus dem ersten Thread in dem Prozessor (10) zu empfangen, wobei die Decodiereinheit (21) dazu dient, in Erwiderung des ersten Befehls des ersten Threads Befehle des ersten Threads für eine Zeitdauer daran zu hindern, zur Ausführung verarbeitet zu werden, während Befehle aus dem zweiten Thread zur Ausführung verarbeitet werden können, und wobei die Decodiereinheit (21) ferner dazu dient, in Erwiderung der Ausführung des ersten Befehls ein Gestatten einer Verarbeitung zur Ausführung von Befehlen des ersten Threads wieder aufzunehmen.
Die Einrichtung nach Anspruch 23, wobei eine Ausführung von Software-Code durch den Prozessor bewirkt, daß der erste Befehl an der Decodiereinheit empfangen wird.
Die Einrichtung nach Anspruch 18, wobei die Einrichtung ein Prozessor mit einer Decodiereinheit ist und die Decodiereinheit (21) dazu dient, den ersten Befehl aus dem ersten Thread zu empfangen und den Prozessor zu veranlassen, die Verarbeitung von Befehlen aus dem ersten Thread in Erwiderung des ersten Befehls für eine Zeitdauer auszusetzen, wobei die Decodiereinheit (21) in der Lage ist, Befehle aus dem zweiten Thread während der Zeitdauer zu verarbeiten, und wobei die Decodiereinheit (21) dazu dient, die Verarbeitung von Befehlen aus dem ersten Thread in Erwiderung des ersten Befehls wiederaufzunehmen.
Der Prozessor nach Anspruch 25, wobei die Decodiereinheit es den Befehlen aus dem zweiten Thread ermöglicht, während der Zeitdauer ausgeführt zu werden.
Der Prozessor nach Anspruch 26, wobei die Decodiereinheit dazu dient, die Verarbeitung von Befehlen nach dem ersten Befehl aus dem ersten Thread während der Zeitdauer auszusetzen.
Der Prozessor nach Anspruch 27, wobei die Decodiereinheit dazu dient, die Ausführung von Befehlen aus dem ersten Thread zu verhindern, indem die Abfertigung (dispatch) von weiteren Befehlen aus dem ersten Thread verhindert wird, bis der erste Befehl festgeschrieben (retired) ist.
Der Prozessor nach Anspruch 25, wobei die Dauer eine vorgegebene Zeitdauer ist.
Eine Einrichtung mit einer Decodiereinheit, gekennzeichnet dadurch, daß: die Decodiereinheit dazu dient, zu bestimmen, ob ein erster Befehl für einen ersten Thread ein Befehl einer ersten Art ist; ein Zähler mit der Decodiereinheit gekoppelt ist, wobei der Zähler dazu dient, initiiert zu werden, wenn der erste Befehl für den ersten Thread ein Befehl der ersten Art ist, wobei die Decodiereinheit dazu dient, Befehle des ersten Thread daran zu hindern, zur Ausführung verarbeitet zu werden, bis der Zähler einen vorgegebenen Wert erreicht; und wobei Befehle für einen zweiten Thread zur Ausführung verarbeitet werden können, während Befehle des ersten Thread an der Ausführung gehindert werden, und wobei die Decodiereinheit die Verarbeitung von Befehlen des ersten Threads in Abhängigkeit von dem Zähler wieder aufnimmt.
Die Einrichtung nach Anspruch 30, wobei der erste Befehl einen in den Zähler zu ladenden Operanden enthält.
Die Einrichtung nach Anspruch 31, wobei die Decodiereinheit mit ihrem Betrieb fortfahren kann, während der erste Thread an der Verarbeitung gehindert wird.