DE60319239T2

DE60319239T2 - Bewegungsschätzung mit gewichteter vorhersage

Info

Publication number: DE60319239T2
Application number: DE60319239T
Authority: DE
Inventors: Jill MacDonald Manalapan BOYCE; Alan Jay Princeton Junction STEIN
Original assignee: Thomson Licensing SAS
Current assignee: Thomson Licensing SAS
Priority date: 2002-07-15
Filing date: 2003-07-11
Publication date: 2009-02-26
Anticipated expiration: 2023-07-12
Also published as: JP2005533464A; EP1540824A2; AU2003259110A8; WO2004008642A2; MY137057A; BRPI0305517B1; BR0305517A; CN1669330A; EP1540824A4; JP4533841B2; TWI234402B; TW200412799A; CN100450185C; US7376186B2; AU2003259110A1; MXPA05000672A; EP1540824B1; US20040008782A1; ES2301828T3; WO2004008642A3

Description

Gebiet der Erfindung
Die vorliegende Erfindung ist auf Videokodierer und -dekodierer und insbesondere auf eine integrierte Bewegungsschätzung mit gewichteter Vorhersage bei Videokodierern und -dekodierern gerichtet.
Hintergrund der Erfindung
Videodaten werden allgemein in Form von Bitströmen bearbeitet und übertragen. Typische Videokompressionskodierer und -dekodierer ("CODECs") gewinnen viel an ihrer Kompressionsergiebigkeit durch Bildung einer Bezugsbildvorhersage eines zu codierenden Bildes und codieren die Differenz zwischen dem laufenden Bild und der Vorhersage. Je enger die Vorhersage mit dem laufenden Bild korreliert wird, desto weniger Bits werden zum Komprimieren dieses Bildes benötigt, wodurch der Wirkungsgrad des Prozesses erhöht wird. Von daher ist es wünschenswert, die bestmögliche Bezugsbildvorhersage zu bilden.
Bei vielen Videokompressionsstandards, einschließlich Moving Picture Experts Group ("MPEG")-1, MPEG-2, MPEG-4, wird eine bewegungskompensierte Version eines vorheriges Bezugsbildes als Vorhersage für das laufende Bild benutzt, und nur die Differenz zwischen dem laufenden Bild und der Vorhersage wird codiert. Wenn nur eine Bildvorhersage ("P-Bild") benutzt wird, wird das Bezugsbild nicht skaliert, wenn die bewegungskompensierte Vorhersage gebildet wird. Wenn die bidirektionalen Bildvorhersagen ("B-Bilder") benutzt werden, werden Zwischenvorhersagen von zwei verschiedenen Bildern gebildet, und dann werden die beiden Zwischenvorhersagen unter Verwendung gleicher Gewichtungsfaktoren von (½, ½) für jede zur Bildung einer einzigen gemittelten Vorhersage zusammen gemittelt. Bei diesen MPEG-Standards sind die beiden Bezugsbilder jeweils eins von der Vorwärtsrichtung und der Rückwärtsrichtung für B-Bilder.
US 5436665 beschreibt eine Codiervorrichtung, die einen Prädiktor enthält, der in der Lage ist, eine Mehrzahl von Vorhersagesignalen von einem Signal mit niedriger Bildauflösung und von einem Signal mit hoher Bildauflösung zu produzieren; das Bild mit niedriger Auflösung ist dabei durch Abwärtsabtasten des Bildes mit hoher Auflösung gebildet, und das Vorhersagesignal, das einen Vorhersagefehler minimiert, wird zum Erzeugen der Daten benutzt, die von der Codiervorrichtung während der Bild-zu-Bild-Vorhersage codiert werden.
US 612218 beschreibt eine Videocodiervorrichtung, die ein Alpha-Map-Signal als Hilfsinformation bezüglich eines Bildes codiert, das ein Objekt und einen Hintergrund enthält, wobei das Alpha-Map-Signal die Form eines Objekts und seine Position in einem Vollbild ausdrückt. Das Alpha-Map-Signal wird von der Videocodiervorrichtung unter Verwendung relativer Adressencodierung codiert und codiert ein Symbol, das eine Position des nächsten Wechselpixels darstellt, das in Bezug auf ein Bezugswechselpixel durch die Verwendung einer Codiertabelle variabler Länge als das bereits codierte Wechselpixel unter Verwendung einer Codiertabelle variabler Länge zu codieren ist.
US 5488482 beschreibt einen Videorecorder, bei dem Video- und Audiosignale in Digitalformat aufgezeichnet und reproduziert werden. Der Videorecorder enthält eine Codiervorrichtung zum Codieren der digitalen Daten, die eine verbesserte Datenkompression produziert und gleichzeitig eine hohe Bildqualität, eine kon sequente Verringerung des Aufzeichnungsbandverbrauchs und einen Videorecorder erbringt, der kompakt und leicht ist.
US 6108040 beschreibt ein Verfahren zum Erkennen von Bewegungsvektordaten, die eine Bewegung eines Teilbereichs in einem Eingabebild von einem beliebigen Bereich auf ein Bezugsbild anzeigen, wobei eine erste Verzerrung zwischen einem von Feldern des Eingabebildes gebildeten Teilbereich und einem von Feldern des Bezugsbildes gebildeten Teilbereich als erster Auswertungswert errechnet wird; eine Position des von den Feldern des Referenzbildes gebildeten Teilbereichs, bei der der erste Auswertungswert der Kleinstwert wird, wird ermittelt; ein Suchfenster auf einem Rahmen des Bezugsbildes wird auf der Grundlage einer ermittelten Position des Teilbereichs erstellt, der von den Feldern des zuvor ermittelten Bezugsbildes gebildet ist; und eine zweite Verzerrung zwischen einem von einem Rahmen in dem eingesetzten Suchfenster gebildeten Teilbereich und einem von einem Rahmen des Eingabebildes gebildeten Teilbereich wird als zweiter Auswertungswert errechnet, und eine Position des von dem Rahmen des Bezugsbildes gebildeten Teilbereichs, bei der der zweite Auswertungswert der Kleinstwert wird, wird ermittelt. Die Rahmenvektoren könne daher auf der Grundlage der Feldvektor-Ermittlungspositionen ermittelt werden, so dass die Menge an Berechnungen, die zur Gewinnung der Rahmenvektoren erforderlich sind, deutlich verringert werden kann, ohne die Erkennungsgenauigkeit der Rahmenvektoren zu verschlechtern.
Zusammenfassung der Erfindung
Diese und weitere Unzulänglichkeiten und Nachteile des Standes der Technik werden durch die vorliegende Erfindung angesprochen, wobei die vorliegende Erfindung in einem Videokodierer zum Codieren von Videosignaldaten für einen Bildblock bezüglich zumindest eines bestimmten Bezugbildes gemäß Anspruch 1 und in einem Verfahren zum Codieren von Videosignaldaten für einen Bildblock nach Anspruch 10 besteht.
Weitere Merkmale der Erfindung finden sich in den abhängigen Ansprüchen.
Ein Videokodierer und -dekodierer ist zum Codieren und Decodieren von Videosignaldaten für einen Bildblock und einen bestimmten Bezugsbildindex zur Vorhersage des Bildblocks vorgesehen, wobei der Kodierer einen Selektor für einen Bezugsbildgewichtungsfaktor mit einem Ausgang, der einen Gewichtungsfaktor entsprechend dem bestimmten Bezugsbildindex anzeigt, einen Multiplizierer in Signalverbindung mit dem Selektor für den Bezugsbildgewichtungsfaktor zur Bereitstellung einer gewichteten Version des Bezugsbildes und eine Bewegungsschätzeinrichtung in Signalverbindung mit dem Multiplizierer zur Breitstellung von Bewegungsvektoren entsprechend der gewichteten Version des Bezugsbildes und der entsprechende Dekodierer eine Bezugsbildgewichtungsfaktoreinheit mit einem Ausgang zur Bestimmung eines Gewichtungsfaktors entsprechend dem bestimmten Bezugsbildindex aufweist.
Ein entsprechendes Verfahren zur Codierung von Videosignaldaten für einen Bildblock umfaßt die Maßnahmen, daß ein im wesentlichen unkomprimierter Bildblock empfangen wird, ein Gewichtungsfaktor für den Bildblock entsprechend einem bestimmten Bezugsbild zugeordnet wird, das Bezugsbild durch den Gewichtungsfaktor gewichtet wird, Bewegungsvektoren entsprechend der Differenz zwischen dem Bildblock und dem gewichteten Bezugsbild berechnet werden, das gewichtete Bezugsbild in Übereinstimmung mit den Bewegungsvektoren bewegungskompensiert wird, die Gewichtungsfaktorselektion als Antwort auf das bewegungskompensierte gewichtete Bezugsbild verbessert wird, das ursprüngliche ungewichtete Bezugsbild in Übereinstimmung mit den Bewegungsvektoren bewegungskompensiert wird, das bewegungskompensierte ursprüngliche Bezugsbild mit dem zugeordneten Gewichtungsfaktor zur Bildung eines gewichteten bewegungskompensierten Bezugsbildes multipliziert wird, das gewichtete bewegungskompensierte Bezugsbild von dem im Wesentlichen unkomprimierten Bildblock subtrahiert wird und ein die Differenz zwischen dem im Wesentlichen unkomprimierten Bildblock und dem gewichteten bewegungskompensierten Bezugsbild anzeigendes Signal codiert wird.
Diese und weitere Aspekte, Merkmale und Vorteile der vorliegenden Erfindung ergeben sich aus der nachfolgenden Beschreibung von Ausführungsbeispielen, die in Verbindung mit den beigefügten Zeichnungen zu lesen ist.
Kurzbeschreibung der Zeichnungen
Die vorliegende Erfindung beinhaltet integrierte Bewegungsschätzung mit gewichteter Vorhersage bei Videokodierern und -dekodierern gemäß den folgenden beispielhaften Figuren; in diesen zeigen:
1 ein Blockdiagramm für einen Standardvideokodierer,
2 ein Blockdiagramm für einen Videokodierer mit Bezugsbildgewichtung,
3 ein Blockdiagramm für einen Videokodierer mit integrierter Bewegungsschätzung und gewichteter Vorhersage in Übereinstimmung mit den Grundlagen der vorliegenden Erfindung,
4 ein Blockdiagramm für einen Standardvideodekodierer,
5 ein Blockdiagramm für einen Videodekodierer mit adaptiver Zweifachvorhersage,
6 ein Fließbild für einen Codierungsvorgang gemäß den Grundlagen der vorliegenden Erfindung,
7 ein Fließbild für einen Decodierungsvorgang gemäß den Grundlagen der vorliegenden Erfindung.
Detaillierte Beschreibung der bevorzugten Ausführungsformen
Es ist ein wirkungsvoller Prozeß für eine integrierte Bewegungsvektorschätzung und eine adaptive Bezugsbildgewichtungsfaktorselektion vorgesehen. Ein iterativer Prozeß wird angewandt, wobei ein anfänglicher Gewichtungsfaktor geschätzt und im Bewegungsschätzprozeß benutzt wird. Die Gewichtungsfaktorschätzung wird auf der Grundlage der Ergebnisse des Bewegungsschätzprozesses verfeinert. Wenn Gewichtungsfaktoren beim Codieren verwendet werden, bestimmt ein Videokodierer sowohl die Gewichtungsfaktoren als auch die Bewegungsfaktoren, jedoch ist die beste Wahl für jeden von beiden von dem anderen abhängig. Die Bewegungsschätzung ist typischerweise der berechnungsintensivste Teil eines digitalen Videokompressionskodierers.
Bei einigen Videosequenzen, insbesondere denjenigen mit Schwund, ist das laufende Bild bzw. der Bildblock, das bzw. der zu codieren ist, stärker mit einem von einem Gewichtungsfaktor skalierten Bezugsbild korreliert als das Bezugsbild selbst.
Video-CODECs ohne auf die Bezugsbilder angewandte Gewichtungsfaktoren codieren Schwundsequenzen sehr unwirksam.
In dem vorgeschlagenen Videokompressionsstandard Joined Video Team ("JVT") kann jedes P-Bild mehrfache Bezugsbilder zur Bildung einer Bildvorhersage benutzen, aber jeder einzelne Bewegungsblock bzw. jede 8×8-Region eines Macroblocks verwendet nur ein einziges Bezugsbild für die Vorhersage. Zusätzlich zur Codierung und Übertragung der Bewegungsvektoren wird ein Bezugsbildindex für jeden Bewegungsblock bzw. jede 8×8-Region übertragen, der anzeigt, welches Bezugsbild verwendet wird. Ein begrenzter Satz möglicher Bezugsbilder wird sowohl beim Kodierer als auch beim Dekodierer gespeichert, und die Anzahl der erlaubten Bezugsbilder wird übertragen.
Beim JVT-Standard werden für bi-prädikative Bilder (auch als "B"-Bilder bezeichnet) zwei Prädiktoren für jeden Bewegungsblock bzw. jede 8×8-Region gebildet, von denen jeder von einem gesonderten Bezugbild kommen kann, und die beiden Prädiktoren werden zur Bildung eines einzigen gemittelten Prädiktors zusammen gemittelt. Für bi-prädikative codierte Bewegungsblöcke können die Bezugsbilder beide von der Vorwärtsrichtung, beide von der Rückwärtsrichtung oder jeweils eins von der Vorwärts- und der Rückwärtsrichtung sein. Es werden zwei Listen der verfügbaren Bezugsbilder, die für die Vorhersage verwendet werden können, bereit gehalten. Die beiden Bezugsbilder werden als die Prädiktoren Liste 0 und Liste 1 bezeichnet. Es wird ein Index für jedes Bezugsbild codiert und übertragen, ref_idx_I0 und ref_idx_I1 für die Bezugsbilder der Liste 0 bzw. der Liste 1. Die prädikativen Bilder nach Joint Video Team ("JVT") bzw. "B"-Bilder erlauben eine adaptive Gewichtung zwischen den beiden Vorhersagen, d. h., Pred = [(P0)·(Pred0)] + [(P1)·(Pred1)] + D, wobei P0 und P1 Gewichtungsfaktoren, Pred0 und Pred1 die Bezugsbildvorhersagen für Liste 0 bzw. 1 sind und D ein Offset ist.
Zwei Verfahren für die Anzeige von Gewichtungsfaktoren werden vorgeschlagen. Bei dem ersten werden die Gewichtungsfaktoren durch die Richtungen bestimmt, die für die Bezugsbilder verwendet werden. Bei diesem Verfahren werden, falls der Index ref_idx_10 kleiner ist oder gleich als ref_idx_I1, Gewichtungsfaktoren von (½, ½) verwendet, ansonsten werden (2, –1) Faktoren verwendet.
Bei dem zweitem Verfahren wird eine beliebige Anzahl von Gewichtungsfaktoren für jedes Slice übertragen. So dann wird ein Gewichtungsfaktorindex für jeden Bewegungsblock bzw. jede 8×8-Region eines Macroblocks übertragen, der bidirektionale Vorhersage verwendet. Der Decoder verwendet den empfangenen Gewichtungsfaktorindex zum Wählen des geeigneten Gewichtungsfaktors, aus dem übertragenen Satz, der beim Decodieren des Bewegungsblocks bzw. der 8×8-Region zu benutzen ist. Wenn z. B. drei Gewichtungsfaktoren bei der Sliceschicht gesendet wären, würden sie Gewichtungsfaktor Indices 0 bzw. 1 bzw. 2 entsprechen.
Es versteht sich, daß irgendwelche Fließbilder, Fließdiagramme, Zustandsübergangsdiagramme, Pseudocodes und dergleichen verschiedene Prozesse darstellen, die im wesentlichen in computerlesbaren Medien dargestellt werden und somit von einem Computer bzw. Prozessor ausgeführt werden können, ob nun ein solcher Computer bzw. Prozessor ausdrücklich gezeigt ist oder nicht.
Die Funktionen der verschiedenen in den Figuren gezeigten Elemente können durch die Verwendung dedizierter Hardware wie auch durch Hardware bereit gestellt werden, die in der Lage ist, Software in Verbindung mit zweckentsprechender Software auszuführen. Bei Bereitstellung durch einen Prozessor können die Funktionen durch einen einzigen Spezialprozessor, durch einen einzigen Gemeinschaftsprozessor oder durch eine Mehrzahl individueller Prozessoren, von denen einige gemeinsam genutzt werden können, bereit gestellt werden. Darüber hinaus soll die explizite Verwendung des Ausdrucks "Prozessor" oder "Controller" nicht so ausgelegt werden, daß sie sich ausschließlich auf zur Ausführung von Software geeignete Hardware bezieht, und kann implizit, ohne Einschränkung, Digitalsignalprozessor-Hardware ("DSP"), Festwertspeicher ("ROM") zum Speichern von Software, Direktzugriffsspeicher ("RAM") und nichtflüchtige Speicherung beinhalten. Andere Hardware, herkömmlich und/oder anwenderspezifisch, kann ebenfalls einbezogen sein. In gleicher Weise sind irgendwelche in den Figuren gezeigte Schalter nur konzeptionell. Ihre Funktion kann durch den Betrieb von Programmlogik, durch dedizierte Logik, durch die Interaktion von Programmsteuerung und dedizierter Logik oder auch manuell ausgeführt werden, wobei die jeweilige Technik durch den Implementierer wählbar ist, wie es aus den Zusammenhang deutlicher verständlich ist.
Entsprechend der Darstellung in 1 ist ein Standardvideokodierer allgemein mit der Bezugszahl 100 angegeben. Ein Eingang zum Kodierer 100 ist in Signalverbindung mit einem nicht-umkehrenden Eingang eines Summenpunktes 110 verbunden. Der Ausgang des Summenpunktes 110 ist in Signalverbindung mit einer Blockübertragungsfunktion 120 verbunden. Die Übertragung 120 ist in Signalverbindung mit einem Quantisierer 130 verbunden. Der Ausgang des Quantisierers 130 ist in Signalverbindung mit einem Kodierer variabler Länge ("VLC") 140 verbunden, wobei der Ausgang des VLC 140 ein von außen zugänglicher Ausgang des Kodierers 100 ist.
Der Ausgang des Quantisierers 130 ist ferner in Signalverbindung mit einem Inversquantisierer 150 verbunden. Der Inversquantisierer 150 ist in Signalverbindung mit einem Inversblocküberträger 160 verbunden, der seinerseits in Signalverbindung mit einem Bezugsbildspeicher 170 verbunden ist. Ein erster Ausgang des Bezugsbildspeichers 170 ist in Signalverbindung mit einem ersten Eingang einer Bewegungsschätzeinrichtung 180 verbunden. Der Eingang des Kodierers 100 ist ferner in Signalverbindung mit einem zweiten Eingang der Bewegungsschätzeinrichtung verbunden. Der Ausgang der Bewegungsschätzeinrichtung 180 ist in Signalverbindung mit einem ersten Eingang eines Bewegungskompensators 190 verbunden. Ein zweiter Ausgang des Bezugsbildspeichers 170 ist in Signalverbindung mit einem zweiten Eingang des Bewegungskompensators 190 verbunden. Der Ausgang des Bewegungskompensators 190 ist in Signalverbindung mit einem invertierenden Eingang des Summenpunktes 110 verbunden.
Es sei nun auf 2 Bezug genommen, in der ein Videokodierer mit Bezugsbildgewichtung allgemein mit der Bezugszahl 200 angegeben ist. Ein Eingang zum Kodierer 200 ist in Signalverbindung mit einem nicht-invertierenden Eingang eines Summenpunktes 210 verbunden. Der Ausgang des Summenpunktes 210 ist in Signalverbindung mit einem Blockübertrager 220 verbunden. Der Übertrager 220 ist in Signalverbindung mit einem Quantisierer 230 verbunden. Der Ausgang des Quantisierers 230 ist in Signalverbindung mit einem VLC 240 verbunden, wobei der Ausgang des VLC 240 ein von außen zugänglicher Ausgang des Kodierers 200 ist.
Der Ausgang des Quantisierers 230 ist ferner in Signalverbindung mit einem Inversquantisierer 250 verbunden. Der Inversquantisierer 250 ist in Signalverbindung mit einem Inversblockübertrager 260 verbunden, der seinerseits in Signalverbindung mit einem Bezugbildspeicher 270 verbunden ist. Ein erster Ausgang des Bezugsbild speichers 270 ist in Signalverbindung mit einem ersten Eingang eines Bezugsbild-Gewichtungsfaktorzuordners 272 verbunden. Der Eingang des Kodierers ist ferner in Signalverbindung mit einem zweiten Eingang des Bezugsbild-Gewichtungsfaktorzuordners 272 verbunden. Der Ausgang des Bezugsbild-Gewichtungsfaktorzuordners 272, der einen Gewichtungsfaktor anzeigt, ist in Signalverbindung mit einem ersten Eingang einer Bewegungschätzeinrichtung 280 verbunden. Ein zweiter Ausgang des Bezugsbildspeichers 270 ist in Signalverbindung mit einem zweiten Eingang der Bewegungsschätzeinrichtung 280 verbunden.
Der Eingang zum Kodierer 200 ist ferner in Signalverbindung mit einem dritten Eingang der Bewegungsschätzeinrichtung 280 verbunden. Der Ausgang der Bewegungsschätzeinrichtung 280, der Bewegungsvektoren anzeigt, ist in Signalverbindung mit einem ersten Eingang eines Bewegungskompensators 290 verbunden. Ein dritter Ausgang des Bezugsbildspeichers 270 ist in Signalverbindung mit einem zweiten Eingang des Bewegungskompensators 290 verbunden. Der Ausgang des Bewegungskompensators 290, der ein bewegungskompensiertes Bezugsbild anzeigt, ist in Signalverbindung mit einem ersten Eingang eines Multiplizierers 292 verbunden. Der Ausgang des Bezugsbild-Gewichtungsfaktorzuordeners 272, der einen Gewichtungsfaktor anzeigt, ist in Signalverbindung mit einem zweiten Eingang des Multiplizierers 292 verbunden. Der Ausgang des Multiplizierers 292 ist in Signalverbindung mit einem invertierendem Eingang des Summenpunktes 210 verbunden.
Es sei nun auf 3 verwiesen, in der ein Videokodierer mit integrierter Bewegungsschätzung und gewichteter Vorhersage allgemein mit der Bezugszahl 300 bezeichnet ist. Ein Eingang zum Kodierer 300 ist in Signalverbindung mit einem nichtinvertierenden Eingang eines Summenpunktes 310 verbunden. Der Ausgang des Summenpunktes 310 ist in Signalverbindung mit einem Blockübertrager 320 ver bunden. Der Übertrager 320 ist in Signalverbindung mit einem Quantisierer 330 verbunden. Der Ausgang des Quantisierers 330 ist in Signalverbindung mit einem VCL 340 verbunden, wobei der Ausgang des VLC 340 ein von außen zugänglicher Ausgang des Kodierers 300 ist.
Der Ausgang des Quantisierers 330 ist ferner in Signalverbindung mit einem Inversquantisierer 350 verbunden. Der Inversquantisierer 350 ist in Signalverbindung mit einem Inversblockübertrager 360 verbunden, der seinerseits in Signalverbindung mit einem Bezugsbildspeicher 370 verbunden ist. Ein erster Ausgang des Bezugsbildspeichers 370 ist in Signalverbindung mit einem ersten Eingang eines Bezugbild-Gewichtungsfaktorselektors 372 verbunden. Der Eingang zum Kodierer 300 ist ferner in Signalverbindung mit einem zweiten Eingang des Bezugbild-Gewichtungsfaktorselektors 372 verbunden, um das laufende Bild an den Selektor zu liefern. Der Ausgang des Bezugsbild-Gewichtungsfaktorselektors 372, der einen Gewichtungsfaktor anzeigt, ist in Signalverbindung mit einem ersten Eingang eines Multiplizierers 374 verbunden. Ein zweiter Eingang des Multiplizierers 374 ist in Signalverbindung mit dem Bezugsbildausgang des Bezugsbildspeichers 370 verbunden. Es ist zu bemerken, daß, obwohl einfach als Multiplizierer 374 dargestellt, andere Arten von Gewichtungsfaktorapplikatoren, die sich von einem Multiplizierer unterscheiden, konzipiert werden können, wie es für den Fachmann offensichtlich ist, wobei dieses alles im Rahmen und Umfang der Erfindung gesehen wird.
Der Ausgang des Multiplizierers 374 ist in Signalverbindung mit einem Speicher 376 für das gewichtete Bezugsbild verbunden. Der Ausgang des Speichers 376 für das gewichtete Bezugsbild ist in Signalverbindung mit einem ersten Eingang einer Bewegungsschätzeinrichtung 380 zur Lieferung eines gewichteten Bezugsbildes verbunden. Der Ausgang der Bewegungsschätzeinrichtung 380 ist in Signalverbind ung mit einem ersten Bewegungskompensator 382 zur Lieferung von Bewegungsvektoren verbunden. Der Ausgang der Bewegungsschätzeinrichtung 380 ist ferner in Signalverbindung mit einem ersten Eingang eines zweiten Bewegungskompensators 390 verbunden. Ein zweiter Ausgang des Speichers 376 für das gewichtete Bezugsbild ist in Signalverbindung mit einem zweiten Eingang des ersten Bewegungskompensators 382 verbunden.
Der Ausgang des ersten Bewegungskompensators 382, der ein gewichtetes bewegungskompensiertes Bild anzeigt, ist in Signalverbindung mit einem ersten Eingang eines Absolutdifferenzgenerators 384 verbunden. Der Eingang zum Kodierer 300, der das laufende Bild ist, ist ferner in Signalverbindung mit einem zweiten Eingang des Absolutdifferenzgenerators 384 verbunden. Der Ausgang der Absolutdifferenzfunktion 384 ist in Signalverbindung mit einem dritten Eingang des Bezugsbild-Gewichtungsfaktorselektors 372 verbunden.
Ein dritter Ausgang des Bezugsbildspeichers 370 ist in Signalverbindung mit einem zweiten Eingang des zweiten Bewegungskompensators 390 verbunden. Der Ausgang des zweiten Bewegungskompensators 390, der ein bewegungskompensiertes Bezugsbild anzeigt, ist in Signalverbindung mit einem ersten Eingang eines Multiplizierers 392 verbunden. Der Ausgang des Bezugsbild-Gewichtungsfaktorselektors 372, der einen Gewichtungsfaktor anzeigt, ist in Signalverbindung mit einem zweiten Eingang des Multiplizierers 392 verbunden. Der Ausgang des Multiplizierers 392 ist in Signalverbindung mit einem invertierenden Eingang des Summenpunktes 310 verbunden.
Wie in 4 gezeigt, ist ein Standardvideodekodierer allgemein mit der Bezugszahl 400 bezeichnet. Der Videodekodierer 400 weist einen Dekodierer variabler Länge ("VLD") 410 auf, der in Signalverbindung mit einem Inversquantisierer 420 verbunden ist. Der Inversquantisierer 420 ist in Signalverbindung mit einem Inversübertrager 430 verbunden. Der Inversübertrager 430 ist in Signalverbindung mit einem ersten Eingangsterminal eines Addier- bzw. Summenpunktes 440 verbunden, wobei der Ausgang des Summenpunktes 440 den Ausgang des Videodekodierers 400 darbietet. Der Ausgang des Summenpunktes 440 ist in Signalverbindung mit einem Bezugsbildspeicher 450 verbunden. Der Bezugsbildspeicher 450 ist in Signalverbindung mit einem Bewegungskompensator 460 verbunden, der in Signalverbindung mit einem zweiten Eingangsterminal des Summenpunktes 440 verbunden ist.
Es sei nun auf 5 verwiesen, in der ein Videodekodierer mit adaptiver Bi-Prädiktion allgemein mit der Bezugszahl 500 angegeben ist. Der Videodekodierer 500 weist einen VLD 510 auf, der in Signalverbindung mit einem Inversquantisierer 520 verbunden ist. Der Inversquantisierer 520 ist in Signalverbindung mit einem Inversübertrager 530 verbunden. Der Inversübertrager 530 ist in Signalverbindung mit einem ersten Eingangsterminal eines Summenpunktes 540 verbunden, wobei der Ausgang des Summenpunktes 540 den Ausgang des Videodekodierers 500 bereitstellt. Der Ausgang des Summenpunktes 540 ist in Signalverbindung mit einem Bezugsbildspeicher 550 verbunden. Der Bezugsbildspeicher 550 ist in Signalverbindung mit einem Bewegungskompensator 560 verbunden, der in Signalverbindung mit einem ersten Eingang eines Multiplizierers 570 verbunden ist.
Der VLD 510 ist ferner in Signalverbindung mit einem Bezugsbild-Gewichtungsfaktorsuchlauf 580 zur Bereitstellung eines adaptiven bi-prädiktiven ("ABP") Koeffizienten-Index zum Suchlauf 580 verbunden. Ein erster Ausgang des Suchlaufs 580 dient zur Bereitstellung eines Gewichtungsfaktors und ist in Signalverbindung mit einem zweiten Eingang des Multiplizierers 570 verbunden. Der Ausgang des Multiplizierers ist in Signalverbindung mit einem ersten Eingang eines Summenpunktes 590 verbunden. Ein zweiter Ausgang des Suchlaufs 580 dient zur Bereitstellung eines Offsets und ist in Signalverbindung mit einem zweitem Eingang des Summenpunktes 590 verbunden. Der Ausgang des Summenpunktes 590 ist in Signalverbindung mit einem zweiten Eingangsterminal des Summenpunktes 540 verbunden.
Es sei nun auf 6 verwiesen, in der ein Bestimmungsprozeß für den Bewegungsvektor und Gewichtungsfaktor allgemein mit der Bezugszahl 600 bezeichnet ist. Hier findet ein Funktionsblock 610 die anfängliche Gewichtungsfaktorschätzung für das laufende Bild bzw. den Bildblock ("cur") und das Bezugsbild ("ref") durch Berechnen des Gewichtungsfaktors "w" = avg(cur)/avg(ref). Der Block 610 steuert einen Entscheidungsblock 612, der bestimmt, ob der Gewichtungsfaktor (w) größer ist als ein Schwellenwert T1 und kleiner als ein Schwellenwert T2. Falls w zwischen T1 und T2 liegt, wird ein Rücklaufblock 614 angesteuert und w = 1 wird als anfänglicher Gewichtungsfaktor benutzt. Falls w nicht zwischen T1 und T2 liegt, wird ein Funktionsblock 616 angesteuert, der den Gewichtungsfaktor w an das Bezugsbild anlegt, um ein gewichtetes Bezugsbild wref zu bilden. Der Block 616 steuert einen Funktionsblock 618 an, um eine Bewegungsschätzung durch Findung von Bewegungsvektoren ("MVs") unter Verwendung des gewichteten Bezugsbildes wref durchzuführen. Der Block 618 steuert einen Funktionsblock 620 an, der ein bewegungskompensiertes gewichtetes Bezugsbild, mcwref, durch Anlegen der MVs an wref bildet. Der Block 620 steuert einen Funktionsblock 622 an, der ein Differenzmaß, diff, berechnet, wobei diff dem absoluten Wert der Summe der Pixelunterschiede zwischen cur und wmcref gleich ist.
Der Block 622 steuert einen Entscheidungsblock 624 an, der bestimmt, ob diff größer ist als das vorherige beste diff. Wenn diff größer ist als das vorherige beste diff, wird ein Rücklaufblock 626 angesteuert, der das vorherige beste diff benutzt. Falls diff nicht größer ist als das vorherige beste diff, wird ein Entscheidungsblock 628 angesteuert, der bestimmt, ob diff kleiner ist als ein Schwellenwert T. Wenn diff kleiner ist als der Schwellenwert T, wird ein Rücklaufblock 634 angesteuert, der die laufenden Schätzungen benutzt. Wenn diff nicht kleiner ist als der Schwellenwert T, wird ein Funktionsblock 630 angesteuert, der ein bewegungskompensiertes Bezugsbild, mcref, durch Anlegen der MVs an ref bildet. Der Block 630 steuert einen Funktionsblock 632 an, der die Gewichtungsfaktorschätzung verfeinert, indem w gleich avg(cur)/avg(mcref) gesetzt wird. Der Block 632 steuert zurück zum Funktionsblock 616 für die weitere Bearbeitung. Damit basiert die Entscheidung zu einer weiteren Verfeinerung des Gewichtungsfaktors auf dem Vergleichen eines Differenzmaßes mit einer Schwelle bzw. Toleranz.
Es sei nun auf 7 verwiesen, in der ein beispielhafter Prozeß zum Decodieren von Videosignaldaten für einen Bildblock allgemein mit der Bezugszahl 700 bezeichnet ist. Der Prozeß weist einen Startblock 710 auf, der einen Eingabeblock 712 ansteuert. Der Eingabeblock 712 empfängt die komprimierten Bildblockdaten und steuert einen Eingabeblock 714 an. Der Eingabeblock 714 empfängt zumindest einen Bezugsbildindex mit den Daten für den Bildblock, wobei jeder Bezugsbildindex einem bestimmten Bezugsbild entspricht. Der Eingabeblock 714 steuert einen Funktionsblock 716 an, der einen Gewichtungsfaktor entsprechend jedem der empfangenen Bezugsbildindizes bestimmt und einen optionalen Funktionsblock 717 ansteuert. Der optionale Funktionsblock 717 bestimmt einen Versatz entsprechend jedem der empfangenen Bezugsbildindizes und steuert einen Funktionsblock 718 an. Der Funktionsblock 718 gewinnt ein Bezugsbild entsprechend jedem der em pfangenen Bezugsbildindizes zurück und steuert einen Funktionsblock 720 an. Der Funktionsblock 720 seinerseits bewegungskompensiert das zurückgewonnene Bezugsbild und steuert einen Funktionsblock 722 an. Der Funktionsblock 722 multipliziert das bewegungskompensierte Bezugsbild mit dem entsprechenden Gewichtungsfaktor und steuert einen optionalen Funktionsblock 723 an. Der optionale Funktionsblock 723 addiert das bewegungskompensierte Bezugsbild zum entsprechenden Versatz und steuert einen Funktionsblock 724 an. Der Funktionsblock 724 bildet seinerseits ein gewichtetes bewegungskompensiertes Bezugsbild und steuert einen Endblock 726 an.
Bei dem vorliegenden Ausführungsbeispiel wird für jedes codierte Bild bzw. Slice ein Gewichtungsfaktor jedem erlaubbaren Bezugsbild zugeordnet, so daß Blöcke des laufenden Bildes diesbezüglich codiert werden können. Wenn jeder individuelle Block im laufenden Bild codiert bzw. decodiert ist, werden der/die Gewichtungsfaktor(en) und Versatz(e), die seinen Bezugsbildindizes entsprechen, auf die Gewichtungsvorhersage zur Bildung eines Gewichtungsprädiktors angelegt. Alle Blöcke im Slice, die in Bezug auf das gleiche Bezugsbild codiert sind, legen den gleichen Gewichtungsfaktor auf die Bezugsbildvorhersage an.
Ob eine adaptive Gewichtung beim Codieren eines Bildes angewandt wird oder nicht, kann im Bildparametersatz bzw. Sequenzparametersatz oder im Slice bzw. Bildheader angegeben werden. Für jedes Slice bzw. Bild, daß eine adaptive Gewichtung verwendet, kann ein Gewichtungsfaktor für jedes der erlaubbaren Bezugsbilder übertragen werden, der zum Codieren dieses Slice bzw. Bildes benutzt werden kann. Die Anzahl von erlaubbaren Bezugsbildern wird im Sliceheader übertragen. Wenn z. B. drei Bezugsbilder zum Codieren des laufenden Slice verwendet werden können, werden bis zu drei Gewichtungsfaktoren übertragen, und sie werden dem Bezugsbild mit dem gleichen Index zugeordnet.
Falls keine Gewichtungsfaktoren übertragen werden, werden Vorgabegewichte benutzt. Bei einer Ausführungsform der vorliegenden Erfindung werden Vorgabegewichte von (½, ½) benutzt, wenn keine Gewichtungsfaktoren übertragen werden. Die Gewichtungsfaktoren können unter Verwendung entweder fester Codes oder solcher variabler Länge übertragen werden.
Anders als bei typischen Systemen entspricht jeder Gewichtungsfaktor, der mit jedem Slice, Block oder Bild übertragen wird, einem bestimmten Bezugsbildindex. Früher wurde ein Satz von Gewichtungsfaktoren, die mit jedem Slice bzw. Bild übertragen wurden, nicht bestimmten Bezugsbildern zugeordnet. Statt dessen wurde ein adaptiver Bi-Prädiktionsgewichtungsindex für jeden Bewegungsblock bzw. 8×8-Bereich übertragen, um auszuwählen, welcher von den Gewichtungsfaktoren aus dem übertragenen Satz für jenen besonderen Bewegungsblock bzw. 8×8-Bereich anzulegen wäre. Bei der gegenwärtigen Ausführungsform der vorliegenden Erfindung wird der Gewichtungsfaktorindex für jeden Bewegungsblock bzw. 8×8-Bereich nicht explizit übermittelt. Statt dessen wird der Gewichtungsfaktor, der mit dem übertragenen Bezugsbildindex assoziiert ist, verwendet. Dieses reduziert drastisch den Organisationsaufwand im übertragenen Bitstrom zur Ermöglichung der adaptiven Gewichtung von Bezugsbildern.
Dieses System und diese Technik können entweder auf prädiktive "P"-Bilder angewandt werden, die mit nur einem Prädiktor codiert werden, oder auf bi-prädiktive "B"-Bilder, die mit zwei Prädiktoren codiert werden. Die Decodierungsprozesse, die sowohl bei Kodierern als auch Dekodierern vorhanden sind, werden nachstehend für die P- und B-Bildfälle beschrieben. Statt dessen kann diese Technik auch auf Codierungssysteme angewandt werden, die Konzepte ähnlich I-, B- und P-Bildern benutzen.
Es können die gleichen Gewichtungsfaktoren für einzeldirektionale Vorhersage bei P-Bildern und für bi-direktionale Vorhersage bei B-Bildern benutzt werden. Wenn nur ein Prädiktor für einen Macroblock bei P-Bildern oder für einzeldirektionale Vorhersage in B-Bildern benutzt wird, wird nur ein Bezugsbildindex für den Block übermittelt. Nachdem der Decodierungsprozeßschritt der Bewegungskompensation einen Prädiktor erzeugt, wird der Gewichtungsfaktor auf den Prädiktor angelegt. Der gewichtete Prädiktor wird dann dem codierten Rest hinzuaddiert, und zur Bildung des decodierten Bildes wird ein Clipping an der Summe durchgeführt. Zur Verwendung für Blöcke bei P-Bildern oder für Blöcke bei B-Bildern, die nur eine Vorhersage der Liste 0 benutzen, wird der gewichtete Prädiktor gebildet als: Pred = W0·Pred0 + D0 (1),wobei W0 der dem Bezugsbild der Liste 0 zugeordnete Gewichtungsfaktor, D0 der dem Bezugsbild der Liste 0 zugeordnete Versatz und Pred0 der bewegungskompensierte Vorhersageblock vom Bezugsbild der Liste 0 ist.
Zur Verwendung für Blöcke in B-Bildern, die nur eine Vorhersage der Liste 1 verwenden, wird der gewichtete Prädiktor gebildet als: Pred = W1·Pred1·D1 (2), wobei W1 der dem Bezugsbild der Liste 1 zugeordnete Gewichtungsfaktor, D0 der dem Bezugsbild der Liste 1 zugeordnete Versatz und Pred1 der bewegungskompensierte Vorhersageblock vom Bezugsbild der Liste 1 ist.
Die gewichteten Prädiktoren können geclippt werden, um zu gewährleisten, daß die resultierenden Werte innerhalb des erlaubten Bereichs von Pixelwerten, typischerweise 0–255, liegen. Die Genauigkeit der Multiplikation in den Gewichtungsformen kann auf eine beliebige vorherbestimmte Anzahl von Auflösungsbits beschränkt werden.
In bi-prädiktiven Fall werden Bezugsbildindizes für jeden der beiden Prädiktoren übermittelt. Eine Bewegungskompensation wird zur Bildung der beiden Prädiktoren durchgeführt. Jeder Prädiktor verwendet den dem Bezugsbildindex zugeordneten Gewichtungsfaktor zur Bildung zweier gewichteter Prädiktoren. Die beiden gewichteten Prädiktoren werden dann zur Bildung eines gemittelten Prädiktors zusammengemittelt, der dann dem codierten Rest hinzuaddiert wird.
Zur Verwendung für Blöcke in B-Bildern, die Vorhersagen der Liste 0 und Liste 1 verwenden, wird der gewichtete Prädiktor gebildet als: Pred = (P0·Pred0 + D0 + P1·Pred1· D1)/2 (3).
Am gewichteten Prädiktor oder einem der Zwischenwerte in der Berechnung des gewichteten Prädiktors kann ein Clipping vorgenommen werden, um zu gewährleisten, daß die resultierenden Werte im erlaubbaren Bereich der Pixelwerte, typischerweise 0–255, liegen.
Somit wird ein Gewichtungsfaktor auf die Bezugsbildvorhersage eines Videokompressionskodierers und -dekodierers angewandt, der mehrfache Bezugsbilder verwendet. Der Gewichtungsfaktor eignet sich für individuelle Bewegungsblöcke in einem Bild auf der Grundlage des Bezugsbildindex, der für diesen Bewegungsblock benutzt wird. Da der Bezugsbildindex bereits im komprimierten Videobitstrom übermittelt wird, ist der zusätzliche Aufwand zur Anpassung des Gewichtungsfaktors an eine Bewegungsblockbasis drastisch reduziert. Sämtliche Bewegungsblöcke, die in Bezug auf das gleiche Bezugsbild codiert werden, legen den gleichen Gewichtungsfaktor auf die Bezugsbildvorhersage an.
Bewegungsschätztechniken sind ausgiebig untersucht worden. Für jeden Bewegungsblock eines Bildes, das codiert wird, wird ein Bewegungsvektor gewählt, der eine Verschiebung des Bewegungsblocks von einem Bezugsbild darstellt. In einem erschöpfenden Suchverfahren innerhalb einer Suchregion wird jede Verschiebung innerhalb eines vorbestimmten Versatzbereichs bezüglich der Bewegungsblockposition getestet. Der Test beinhaltet die Berechnung der Summe der absoluten Differenz ("SAD") oder der Standardabweichung ("MSE") jedes Pixels im Bewegungsblock im laufenden Bild mit dem verschobenen Bewegungsblock in einem Bezugsbild. Der Versatz des niedrigsten SAD oder MSE wird als Bewegungsvektor gewählt. Es sind zahlreiche Abweichungen zu dieser Technik vorgeschlagen worden, wie etwa ein dreistufiger Suchvorgang und ratenverzerrungsoptimierte Bewegungsschätzung, die sämtlich den Schritt des Berechnens des SAD oder MSE des laufenden Bewegungsblocks mit einem verschobenen Bewegungsblock in einem Bezugsbild beinhalten.
Die Berechnungskosten der Bestimmung von Bewegungsvektoren und adaptiven Bezugsbildgewichtungsfaktoren kann durch Verwendung eines iterativen Prozesses reduziert werden, dabei noch unter Auswahl von Bewegungsvektoren und Gewichtungsfaktoren, die in der Lage sind, eine hohe Kompressionswirksamkeit zu erzielen. Ein Bestimmungsprozeß für einen Bewegungsvektor und Gewichtungsfaktor nach einem Ausführungsbeispiel wird beschrieben, unter der Annahme, daß nur ein Gewichtungsfaktor auf das gesamte Bezugsbild angelegt wird, obgleich die Anwendung der Grundlagen der vorliegenden Erfindung nicht auf einen derartigen Fall beschränkt ist. Der Prozeß könnte auch auf kleinere Regionen des Bildes, wie z. B. Slices, angewandt werden. Außerdem kann, obgleich ein Ausführungsbeispiel der Erfindung mit Verwendung nur eines einzigen Bezugsbildes beschrieben wird, die vorliegende Erfindung auch auf eine mehrfache Bezugsbildvorhersage und auf bi-prädiktive Bilder angewandt werden.
Die Berechnung des Bewegungsvektors für einen Bewegungsblock kann typischerweise am besten erfolgen, wenn der zu benutzende Gewichtungsfaktor bekannt ist. In einem Ausführungsbeispiel wird eine Schätzung des Gewichtungsfaktors unter Verwendung des Bezugsbildes und der laufenden Bezugsbildpixelwerte gebildet. Der Gewichtungsfaktor kann auf eine Anzahl von Auflösungsbits begrenzt werden. Wenn der Gewichtungsfaktor sehr nahe bei 1 liegt, besteht keine Notwendigkeit, den Gewichtungsfaktor im Bewegungsschätzprozeß zu berücksichtigen, und es kann eine normale Bewegungsschätzung mit dem als gleich 1 angenommenen Gewichtungsfaktor erfolgen. Anderenfalls wird die Gewichtungsfaktorschätzung auf das Bezugsbild angelegt. Die Bewegungsschätzung wird dann unter Verwendung einer beliebigen Methode ausgeführt, die SAD oder MSE berechnet, wobei jedoch die SAD- oder MSE-Berechnung zwischen dem laufenden Bildbewegungsblock und dem verschobenen Bewegungsblock in der gewichteten Version des Bezugsbildes und nicht des ungewichteten Bezugsbildes ausgeführt wird. Nach der Auswahl der Bewegungsvektoren kann die Schätzung des gewichteten Faktors, falls nötig, verfeinert werden.
Die laufenden Bewegungsvektoren werden auf das gewichtete Bezugsbild zur Bildung des gewichteten, bewegungskompensierten Bezugsbildes angelegt. Ein Differenzmaß zwischen dem gewichteten bewegungskompensierten Bezugsbild und dem laufenden Bild wird berechnet. Falls das Differenzmaß kleiner ist als eine Schwelle oder kleiner als das vorherige beste Differenzmaß, ist der Prozeß vollständig, und die laufenden anstehenden Bewegungsvektoren und Gewichtungsfaktoren werden akzeptiert.
Falls das Differenzmaß höher ist als eine bestimmte Schwelle, kann der Gewichtungsfaktor verfeinert werden. In diesem Fall wird ein bewegungskompensiertes, jedoch ungewichtetes Bezugsbild auf der Grundlage der laufenden anstehenden Bewegungsvektoren gebildet. Die Gewichtungsfaktorschätzung wird unter Verwendung des bewegungskompensierten Bezugsbildes und des laufenden Bildes verfeinert, und nicht unter Verwendung des unkompensiertem Bezugsbildes, wie es bei der Bildung der anfänglichen Schätzung des Gewichtungsfaktors erfolgte.
Der Auswahlprozeß geht iterativ weiter unter Anwendung des frisch verfeinerten Gewichtungsfaktors auf das Bezugsbild zur Bildung des gewichteten Bezugsbildes. Der iterative Prozeß setzt sich fort, bis das Differenzmaß gleich oder höher ist als ein früheres bestes Differenzmaß oder niedriger als eine Schwelle oder alternativ, bis eine definierte Anzahl von Zyklen vollendet ist. Wenn das Differenzmaß der laufenden Iteration höher ist als für die beste frühere Iteration, werden der Gewichtungsfaktor und die Bewegungsvektoren für die beste frühere Iteration verwendet. Wenn das Differenzmaß der laufenden Iteration kleiner ist als eine Schwelle, werden der laufende Gewichtungsfaktor und Bewegungsvektoren verwendet. Wenn die maximale Anzahl von Iterationszyklen vollendet ist, werden der Gewichtungsfaktor und die Bewegungsvektoren von der früheren Iteration, die das beste Differenzmaß hatte, verwendet.
Bei einer Ausführungsform ist die Anfangsschätzung des Gewichtungsfaktors, w, das Verhältnis zwischen dem Durchschnittswert der Pixel im laufenden Bild, cur, geteilt durch den Durchschnittswert der Pixel im Bezugsbild, ref, wobei: w = avg(cur)/avg(ref) (4)
Die Verfeinerungsschätzungen sind das Verhältnis zwischen dem Durchschnitt von Pixeln im laufenden Bild und dem Durchschnitt von Pixeln im bewegungskompensierten Bezugsbild, mcref, bei: w = avg(cur)/avg(mcref) (5)
Das Differenzmaß diff ist der absolute Wert des Durchschnitts von Pixeldifferenzen zwischen dem laufenden Bild, cur, und dem gewichteten bewegungskompensierten Bezugsbild, wmcref, wobei: diff = |Σcur – wmcref| (6)
Bei einer weiteren Ausführungsform ist das Differenzmaß die Summe der absoluten Differenzen der Pixel im laufenden Bild und im gewichteten bewegungskompensierten Bezugsbild, wobei: diff = Σ|cur – wmcref| (7)
Wenn eine Bewegungsschätzung auf Blockbasis durchgeführt wird, wird das gleiche Pixel in einem Bezugsbild für zahlreiche SAD-Berechnungen verwendet. In einem Ausführungsbeispiel wird während des Bewegungsschätzprozesses, sobald ein Gewichtungsfaktor auf ein Pixel in einem Bezugsbild angelegt worden ist, das gewichtete Pixel zusätzlich zu dem normalen Pixel gespeichert. Die Speicherung kann entweder für eine Region des Bildes oder für das ganze Bild erfolgen.
Die gewichteten Bezugsbildwerte können geclippt werden, um mit der gleichen Anzahl von Bits wie ein ungewichteter Bezug, wie beispielsweise etwa 8 Bits, gespeichert zu werden, oder können unter Verwendung mehrerer Bits gespeichert werden. Wenn Clipping für den Bewegungskompensationsprozeß durchgeführt wird, was speicherwirksamer ist, wird der Gewichtungsfaktor wieder auf das Bezugsbild für den aktuellen ausgewählten Bewegungsfaktor angelegt, wobei die Differenz unter Verwendung zusätzlicher Bits berechnet und das Clipping nach der Differenz ausgeführt wird, um eine Fehlanpassung mit einem Dekodierer zu vermeiden, was anderenfalls auftreten könnte, falls der Dekodierer nicht das Clipping ausführt, nachdem der Gewichtungsfaktor angelegt ist.
Wenn mehrfache Bezugsbilder zum Codieren eines Bildes benutzt werden, kann ein gesonderter Gewichtungsfaktor für jedes Bezugsbild berechnet werden. Bei der Bewegungsschätzung werden ein Bewegungsvektor und ein Bezugsbildindex für jeden Bewegungsblock ausgewählt. Für jede Iteration des Prozesses werden Bewegungsvektoren und Gewichtungsfaktoren für jedes Bezugsbild gesucht.
In einer bevorzugten Ausführungsform wird während der Bewegungsschätzung das beste Bezugsbild für einen gegebenen Bewegungsblock bestimmt. Die Berechnung des Differenzmaßes wird gesondert für jedes Bezugsbild vorgenommen, wobei nur diejenigen Bewegungsblöcke, die dieses Bezugsbild verwenden, in der Berechnung verwendet werden. Die Verfeinerung der Gewichtungsfaktorschätzung für ein gegebenes Bezugsbild verwendet ebenfalls nur jene Bewegungsblöcke, die unter Verwendung dieses Bezugsbildes codiert werden. Für eine bi-prädiktive Codierung können Gewichtungsfaktoren und Bewegungsvektoren getrennt für jede der beiden Vorhersagen bestimmt werden, die zur Bildung der gemittelten Vorhersage zusammen gemittelt werden.
Die Grundlagen der vorliegenden Erfindung können auf viele unterschiedliche Arten von Bewegungsschätzalgorithmen angewandt werden. Bei Verwendung mit hierarchischen Ansätzen kann die Iteration der Gewichtungsfaktorauswahl und Bewegungsvektorauswahl mit einer beliebigen Stufe der Bewegungsschätzhierarchie verwendet werden. Zum Beispiel kann der iterative Ansatz mit einer Bewegungsschätzung des ganzzahligen Bildelements ("pel") verwendet werden. Nachdem der Gewichtungsfaktor und die ganzzahligen Bewegungsvektoren unter Verwendung des vorgesehenen iterativen Algorithmus gefunden sind, können die sub-pel-Bewegungsvektoren gefunden werden, ohne daß eine weitere Iteration der gewichteten Faktorauswahl erforderlich ist.
In besonders bevorzugter Weise werden die Grundsätze der vorliegenden Erfindung als eine Kombination von Hardware und Software implementiert. Darüber hinaus wird die Software vorzugsweise als ein Anwenderprogramm implementiert, das abgreifbar bei einer Programmspeichereinheit verkörpert ist. Das Anwenderprogramm kann auf eine Maschine mit einer geeigneten Architektur hinaufgeladen und von dieser ausgeführt werden. Vorzugsweise ist die Maschine an einer Computerplattform mit Hardware wie einer oder mehreren zentralen Verarbeitungseinheiten ("CPU"), einem Direktzugriffsspeicher ("RAM") und Ein-/Ausgabe-Schnittstellen ("I/O") implementiert. Die Computerplattform kann auch ein Betriebssystem und einen Mikrobefehlscode aufweisen. Die verschiedenen hier beschriebenen Prozesse und Funktionen können entweder Teil des Mikrobefehlscodes oder Teil des Anwenderprogramms oder irgendeine Kombination hiervon sein, die durch eine CPU ausgeführt werden kann. Zusätzlich können verschiedenartige weitere periphere Einheiten, wie etwa eine zusätzliche Datenspeichereinheit und eine Druckeinheit mit der Computerplattform verbunden sein.

Claims

Videokodierer (300) zum Kodieren von Videosignaldaten für einen Bildblock bezüglich zumindest eines bestimmten Bezugsbilds, dadurch gekennzeichnet, daß der Kodierer folgendes umfaßt: einen Selektor (372) für einen Bezugsbildgewichtungsfaktor mit einem Ausgang, der einen Gewichtungsfaktor entsprechend dem zumindest einen bestimmten Bezugsbild anzeigt, einen Gewichtungsfaktorapplikator (374) in Signalverbindung mit dem Selektor für den Bezugsbildgewichtungsfaktor zur Bereitstellung einer gewichteten Version des zumindest einen bestimmten Bezugsbilds und eine Bewegungsschätzeinrichtung (380) in Signalverbindung mit dem Gewichtungsfaktorapplikator zur Bereitstellung von Bewegungsvektoren entsprechend der gewichteten Version des zumindest einen bestimmten Bezugsbilds.
Videokodierer (300) nach Anspruch 1, ferner mit einem Bezugsbildspeicher (370) in Signalverbindung mit dem Selektor (372) für den Bezugsbildgewichtungsfaktor zur Bereitstellung des zumindest einen bestimmten Bezugsbilds und eines entsprechenden bestimmten Bezugsbildindex.
Videokodierer (300) nach Anspruch 2, ferner mit einem Kodierer (340) mit variabler Länge in Signalverbindung mit dem Bezugsbildspeicher (370) zum Kodieren des bestimmten Bezugsbildindex entsprechend dem zumindest einen bestimmten Bezugsbild.
Videokodierer (300) nach Anspruch 1, ferner mit einem Speicher (376) für das gewichtete Bezugsbild in Signalverbindung mit dem Selektor für den Bezugsbildgewichtungsfaktor zum Speichern einer gewichteten Version des Bezugsbilds.
Videokodierer (300) nach Anspruch 1, ferner mit einem Bewegungskompensator (390) in Signalverbindung mit dem Selektor (372) für den Bezugsbildgewichtungsfaktor zur Bereitstellung von auf den Selektor für den Bezugsbildgewichtungsfaktor ansprechenden bewegungskompensierten Bezugsbildern.
Videokodierer (300) nach Anspruch 5, ferner mit einem Multiplizierer (392) in Signalverbindung mit dem Bewegungskompensator (390) und dem Selektor (372) für den Bezugsbildgewichtungsfaktor zum Anlegen eines Gewichtungsfaktors an ein bewegungskompensiertes Bezugsbild.
Videokodierer (300) nach Anspruch 1, ferner mit einem Bewegungskompensator (382) in Signalverbindung mit der Bewegungsschätzeinrichtung (380) zur Bereitstellung von auf den Selektor für den Bezugsbildgewichtungsfaktor und die Bewegungsschätzeinrichtung ansprechenden gewichteten bewegungskompensierten Bezugsbildern.
Videokodierer (300) nach Anspruch 7, verwendbar mit bi-prädiktiven Bildprädiktoren, wobei der Kodierer ferner Prädiktionsmittel zum Bilden von ersten und zweiten Prädiktoren von zwei verschiedenen Bezugsbildern umfaßt.
Videokodierer (300) nach Anspruch 8, bei dem die beiden verschiedenen Bezugsbilder beide dieselbe Richtung in Bezug auf den Bildblock haben.
Verfahren (600) zum Kodieren von Videosignaldaten für einen Bildblock bezüglich zumindest eines bestimmten Bezugsbilds, wobei das Verfahren durch die Schritte gekennzeichnet ist, daß ein zu komprimierender Bildblock empfangen wird, ein Gewichtungsfaktor für den Bildblock entsprechend dem zumindest einen bestimmten Bezugsbild zugeordnet wird (610), das zumindest eine Bezugsbild durch den Gewichtungsfaktor gewichtet wird (616), Bewegungsvektoren entsprechend der Differenz zwischen dem Bildblock und dem gewichteten Bezugsbild berechnet werden (618), das gewichtete Bezugsbild in Übereinstimmung mit den Bewegungsvektoren bewegungskompensiert wird (620) und die Gewichtungsfaktorselektion als Antwort auf das bewegungskompensierte gewichtete Bezugsbild verbessert wird (632).
Verfahren nach Anspruch 10, bei dem ferner das ursprüngliche ungewichtete Bezugsbild in Übereinstimmung mit den Bewegungsvektoren bewegungskompensiert wird (630), das bewegungskompensierte ursprüngliche Bezugsbild mit dem zugeordneten Gewichtungsfaktor zur Bildung eines gewichteten bewegungskompensierten Bezugsbilds multipliziert wird, das gewichtete bewegungskompensierte Bezugsbild von dem im wesentlichen unkomprimierten Bildblock subtrahiert wird und ein die Differenz zwischen dem im wesentlichen unkomprimierten Bildblock und dem gewichteten bewegungskompensierten Bezugsbild anzeigendes Signal kodiert wird.
Verfahren nach Anspruch 10, bei dem das Berechnen der Bewegungsvektoren folgenden umfaßt: in einem Suchgebiet prüfen auf jede Verschiebung in einem vorbestimmten Bereich von Offsets in Bezug auf den Bildblock, berechnen von zumindest eins von der Summe von absoluter Differenz und Standardabweichung jedes Pixels im Bildblock mit einem bewegungskompensierten Bezugsbild und den Offset mit der niedrigsten Summe von absoluter Differenz und Standardabweichung als Bewegungsvektor selektieren.
Verfahren nach Anspruch 10, bei dem bi-prädiktive Bildprädiktoren verwendet werden, wobei das Verfahren ferner umfaßt, daß ein zweiter Gewichtungsfaktor für den Bildblock entsprechend einem zweiten bestimmten Bezugsbild zugeordnet wird, das zweite Bezugsbild durch den zweiten Gewichtungsfaktor gewichtet wird, zweite Bewegungsvektoren entsprechend dem Unterschied zwischen dem Bildblock und dem zweiten gewichteten Bezugsbild berechnet werden, das zweite gewichtete Bezugsbild in Übereinstimmung mit den zweiten Bewegungsvektoren bewegungskompensiert wird und die Selektion des zweiten Gewichtungsfaktors als Antwort auf das zweite bewegungskompensierte gewichtete Bezugsbild verbessert wird.
Verfahren nach Anspruch 11, bei dem bi-prädiktive Bildprädiktoren verwendet werden, wobei das Verfahren ferner umfaßt, daß ein zweiter Gewichtungsfaktor für den Bildblock entsprechend einem zweiten bestimmten Bezugsbild zugeordnet wird, das zweite Bezugsbild durch den zweiten Gewichtungsfaktor gewichtet wird, zweite Bewegungsvektoren entsprechend dem Unterschied zwischen dem Bildblock und dem zweiten gewichteten Bezugsbild berechnet werden, das zweite gewichtete Bezugsbild in Übereinstimmung mit den zweiten Bewegungsvektoren bewegungskompensiert wird, die Selektion des zweiten Gewichtungsfaktors als Antwort auf das zweite bewegungskompensierte gewichtete Bezugsbild verbessert wird, das ursprüngliche ungewichtete zweite Bezugsbild in Übereinstimmung mit den zweiten Bewegungsvektoren bewegungskompensiert wird, das bewegungskompensierte ursprüngliche zweite Bezugsbild mit dem zugeordneten zweiten Gewichtungsfaktor zur Bildung eines zweiten gewichteten bewegungskompensierten Bezugsbilds multipliziert wird, das zweite gewichtete bewegungskompensierte Bezugsbild vom im wesentlichen unkomprimierten Bildblock subtrahiert wird und ein die Differenz zwischen dem im wesentlichen unkomprimierten Bildblock und dem zweiten gewichteten bewegungskompensierten Bezugsbild anzeigendes Signal kodiert wird.
Verfahren nach Anspruch 13, bei dem das erste und zweite bestimmte Bezugsbild beide dieselbe Richtung in Bezug auf den Bildblock haben.
Verfahren nach Anspruch 13, bei dem das Berechnen von Bewegungsvektoren folgendes umfaßt: in einem Suchgebiet prüfen auf jede Verschiebung innerhalb eines vorbestimmten Bereichs von Offsets in Bezug auf den Bildblock, berechnen von zumindest eins von der Summe von absoluter Differenz und Standardabweichung jedes Pixels im Bildblock mit einem ersten bewegungskompensierten Bezugsbild entsprechend dem ersten Prädiktor, selektieren eines Offsets mit der niedrigsten Summe von absoluter Differenz und Standardabweichung als Bewegungsvektor für den ersten Prädiktor, berechnen von zumindest eins von der Summe von absoluter Differenz und Standardabweichung jedes Pixels im Bildblock mit einem zweiten bewegungskompensierten Bezugsbild entsprechend dem zweiten Prädiktor und selektieren eines Offsets mit der niedrigsten Summe von absoluter Differenz und Standardabweichung als Bewegungsvektor für den zweiten Prädiktor.
Verfahren nach Anspruch 10, bei dem das Gewichten des Bezugsbilds mit dem Gewichtungsfaktor die Maßnahmen umfaßt, daß bestimmt wird, ob der Gewichtungsfaktor nahe etwa 1 liegt, und das ursprüngliche Bezugsbild als gewichtetes Bezugsbild gewählt wird, wenn der Gewichtungsfaktor nahe etwa 1 liegt.
Verfahren nach Anspruch 10, bei dem das Verbessern der Gewichtungsfaktorselektion als Antwort auf das bewegungskompensierte gewichtete Bezugsbild die Maßnahmen umfaßt, daß eine Differenz zwischen dem Bildblock und dem bewegungskompensierten gewichteten Bezugsbild berechnet, die berechnete Differenz mit einer vorbestimmten Toleranz verglichen und der Gewichtungsfaktor weiter verbessert wird, wenn die errechnete Differenz außerhalb der vorbestimmten Toleranz liegt.