DE60035740T2 - Vorrichtung und Verfahren zur Kodierung von Bewegtbildsignalen - Google Patents

Vorrichtung und Verfahren zur Kodierung von Bewegtbildsignalen Download PDF

Info

Publication number
DE60035740T2
DE60035740T2 DE60035740T DE60035740T DE60035740T2 DE 60035740 T2 DE60035740 T2 DE 60035740T2 DE 60035740 T DE60035740 T DE 60035740T DE 60035740 T DE60035740 T DE 60035740T DE 60035740 T2 DE60035740 T2 DE 60035740T2
Authority
DE
Germany
Prior art keywords
image
complexity
present
encoding
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60035740T
Other languages
English (en)
Other versions
DE60035740D1 (de
Inventor
Kazuhiko Morita
Takayuki Yokosuka-shi Sugahara
Mitsuaki Yokosuka-shi Fujiwara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP17515499A external-priority patent/JP3858520B2/ja
Priority claimed from JP17809099A external-priority patent/JP2001008215A/ja
Priority claimed from JP19014399A external-priority patent/JP4362793B2/ja
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Application granted granted Critical
Publication of DE60035740D1 publication Critical patent/DE60035740D1/de
Publication of DE60035740T2 publication Critical patent/DE60035740T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/15Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

  • HINTERGRUND DER ERFINDUNG
  • Die vorliegende Erfindung bezieht sich auf eine Einrichtung und ein Verfahren zum Enkodieren von Bewegtbild-Signalen. Insbesondere bezieht sich diese Erfindung auf eine Einrichtung und ein Verfahren zum Enkodieren von Bewegtbild-Signalen mit einer Kodemengen-Steuerung für eine variable Bitraten-Enkodierung in Echtzeit.
  • Die Moving Picture Experts Group (MPEG)-2 hat internationale Standards zum Enkodieren von Bewegtbild-Signalen, wie beispielsweise TV-Signale, gegründet.
  • MPEG-2 bietet eine bewegungskompensierte Prädiktion und Transformations-Enkodierung als seine zwei technischen Merkmale an.
  • Bewegungskompensierte Prädiktion: ein Rahmen eines Bewegtbildes wird in 16 × 16 Blöcke aufgeteilt, welche Makroblöcke genannt werden. Für jeden Makroblock wird eine Bewegungsgröße, welche ein Bewegungsvektor genannt wird, zwischen dem derzeit zu kodierenden Bildrahmen und einem Referenzrahmen, welcher vor oder nach dem derzeitigen Bildrahmen auf der Zeitbasis von einer vorbestimmten Anzahl von Rahmen kommt, erfasst. Ein enkodiertes Bild wird auf der Basis des Referenzrahmens und des Bewegungsvektors erzeugt.
  • Transformations-Enkodierung: Ein Bildrahmen oder ein Prädiktionsfehler-Signal, welches durch die bewegungskompensierte Prädiktion erzeugt wird, wird durch die diskrete Kosinus-Transformation (DCT) als eine orthogonale Transformationstechnik komprimiert.
  • Bewegungskompensierte Prädiktion in MPEG-2 erzeugt Bewegtbilder von drei Typen, nämlich I-Bilder (intrakodierte Bilder), P-Bilder (prädiktionskodierte Bilder) und B-Bilder (bidirektional prädiktionskodierte Bilder).
  • I-Bilder werden der DCT, so wie sie sind, unterworfen, andererseits werden bei P- und B-Bildern Prädiktionsfehler-Signale der DCT unterworfen, um DCT-Koeffizienten zu erzeugen, Die DCT-Koeffizienten werden mit einem Quantisierungs-Skalierungsfaktor unter Kodemengen-Steuerung quantisiert.
  • Die quantisierten DCT-Koeffizienten werden durch eine Variable-Länge-Enkodierung mit Zusatzdaten, wie beispielsweise Bewegungsvektoren, enkodiert, um einen Bitstrom zu erzeugen, welcher zu, über einen Puffer ausgegebene, kodierte Daten wird.
  • Ein Quantisierungs-Skalierungsfaktor wird durch Kodemengen-Steuerung gemäß der Größe des Bit-Stroms bestimmt, welcher durch den Puffer passiert.
  • Die quantisierten DCT-Koeffizienten werden ferner einer De-Quantisierung und Invers-DCT (IDCT) zur lokalen Dekodierung unterworfen und in einem Rahmenspeicher pro Makroblock zur bewegungskompensierten Prädiktion gespeichert.
  • Die Menge an Kodes (Bitrate), welche für jede vorbestimmte Periode in MPEG-2 erzeugt werden, ist aufgrund der Variable-Länge-Enkodierung nicht konstant.
  • Um dieses Problem zu lösen, hat das MPEG-2 Techniken zu Quantisierungs-Skalierungsfaktor-Einstellungen pro Makroblock angeboten, um eine konstante Bitrate zu erzielen.
  • Das MPEG-2 Testmodell 5 hat eine Technik einer konstanten Bitratensteuerung zur Erzeugung einer konstanten Menge an Kodes pro Gruppe an Bilder (GOP) vorgeschlagen, um eine konstante Übertragungsrate zu erzielen.
  • Diese Technik weist jedoch beinahe die gleiche Menge an Kodes über die gesamten Abschnitte einer Bewegtbild-Sequenz zu. Die konstante Menge an Kodezuweisung bewirkt eine Verschlechterung der Bilder aufgrund einer unzureichenden Kodezuweisung auf Bilder von komplexen Szenen, welche viele Daten haben, andererseits eine unnötige Kodemengen-Zuweisung auf Bilder von einfachen Szenen, welche wenige Daten haben.
  • Diese Technik ist daher kein geeignetes Bitraten-Steuerverfahren für DVD-Video, welches beispielsweise eine variable Übertragungsrate-Steuerfunktion hat.
  • Eine Technik einer variablen Bitratensteuerung behebt das Problem einer konstanten Bitratensteuerung für DVD-Videos, und ist in der japanischen ungeprüften Patentveröffentlichung No. 1994(6)-141298 offenbart.
  • Bei dieser Technik wird ein eingegebenes Bewegtbild einer temporalen (ersten) Enkodierung mit einem fixierten Quantisierungs-Skalierungsfaktor unterworfen, und die Menge an erzeugten Kodes wird pro spezifische Zeitperiode gezählt. Eine Ziel-Übertragungsrate für jeden Abschnitt, wie beispielsweise ein Rahmen, des eingegebenen Bewegtbildes wird auf der Basis der gezielten Kodemenge eingestellt, so dass die Menge an Kodes des gesamten eingegebenen Bewegtbildes ein spezifischer Wert wird.
  • Das eingegebene Bewegtbild wird dann einer aktuellen (zweiten) Enkodierung mit Bitraten-Einstellungen unterworfen, so dass eine Bitrate für jeden Abschnitt des eingegebenen Bewegtbildes die Ziel-Übertragungsrate wird.
  • Diese variable Bitratensteuerung erfordert jedoch eine Zwei-Zeit-Enkodierung, das heißt eine temporale und aktuelle Enkodierung, wodurch somit keine Echtzeitsteuerung erzielt wird. Die Zwei-Zeit-Enkodierung wird im Folgenden Zwei-Pass-Enkodierung genannt.
  • Im Gegensatz zu einer solchen Zwei-Pass-Enkodierung wurde eine Ein-Pass (Zeit)-Enkodierung mit variabler Bitratensteuerung durch die japanische ungeprüfte Patenveröffentlichung No. 1998(10)-164577 für eine beinahe Echtzeit-Bewegtbild-Enkodierung eingeführt.
  • Diese Technik erlangt eine Bild-Komplexität, welche durch ein Multiplizieren der soweit enkodierten Menge von Kodes mit einem mittleren Quantisierungs-Skalierungsfaktor für jedes Bild berechnet wird. Das Verhältnis der derzeitigen Bild-Komplexität zur mittleren vergangenen Bild-Komplexität wird dazu verwendet, um eine Ziel-Kodemenge oder einen Ziel-Quantisierungs-Skalierungsfaktor zur variablen Bitratensteuerung zu entscheiden.
  • Eine weitere Technik der Ein-Pass-Enkodierung mit variabler Bitratensteuerung ist in der ungeprüften Patentveröffentlichung No. 1998(10)-302396 offenbart.
  • Diese Technik untersucht eine Schwierigkeit beim Enkodieren pro vorgebestimmte Periode, um eine temporale Kodemenge, welche jeder vorbestimmten Periode mit Bezug auf eine Standard Enkodierungs-Schwierigkeit zuzuweisen ist, und eine zuzuweisende Kodemenge zu erlangen.
  • Die zuzuweisende temporale Kodemenge wird auf eine aktuelle zuzuweisende Kodemenge geändert, indem eine zuzuweisende Kodemenge Bav, welche durch Enkodierung gegeben ist, mit einer fixierten zuzuweisenden Kodemenge bav, welche unter einer aktuellen Speicherkapazität eines Speichermediums entschieden wird, und einer gesamten aktuellen Kodemenge Bgen, welche bislang enkodiert ist, verglichen wird; und es erlaubt wird, dass eine Kodemenge zugewiesen wird, welche gleich oder größer als bav ist, wenn Bav – bav positiv ist, wodurch somit eine Aufzeichnung von einer bestimmten Länge eines Bewegtbildes auf ein Speichermedium erzielt wird, so dass eine gesamte Kodemenge, welche für die bestimmte Länge des Bewegtbildes erzeugt wird, kleiner als die Speicherkapazität des Speichermediums ist.
  • Diese Ein-Pass-Enkodierung mit variabler Bitratensteuerung hat ebenfalls die folgenden Nachteile:
    Bei dieser Technik wird die vorliegende Bild-Komplexität durch ein temporäres Enkodieren des vorliegenden Bildes, welches von nun an enkodiert werden wird, erlangt, oder es wird die Bild-Komplexität des gerade zuvor enkodierten Bildes und des gleichen Bild-Typs als die vorliegende Bild-Komplexität ohne temporale Enkodierung verwendet.
  • Die Ein-Pass-Enkodierung bewirkt somit eine Verzögerung beim Enkodieren, wenn sie eine temporale Enkodierung ist und eine große Schaltung erfordert.
  • Darüber hinaus, sogar ohne eine solche temporale Enkodierung, wenn die Bild-Komplexität über Bilder variiert, mit anderen Worten, dass eine Szenen-Änderung gerade vor dem zu enkodierenden vorliegenden Bild auftritt, wird sich die Bild-Komplexität, welche gerade zuvor entschieden ist (der gleiche Bild-Typ), welche als die vorliegende Bild-Komplexität verwendet wird, von der aktuellen Bild-Komplexität unterscheiden. Dies bewirkt eine ungenaue Kodemengen-Zuweisung.
  • Anders als bei der Zwei-Pass-Enkodierung, führt die Ein-Pass-Enkodierung eine Bitratensteuerung aus, ohne zu erfassen, wie eine Bild-Komplexität für eine eingegebene Bewegtbild-Sequenz variiert.
  • Diese Technik führt somit eine Enkodierung unter der Annahme aus, dass eine Gesamtänderung in der Bild-Komplexität von einer eingegebenen Bewegtbild-Sequenz ähnlich der einer mittleren Bild-Komplexität von typischen Bildern ist.
  • Dies bewirkt ebenfalls eine ungenaue Kodemengen-Zuweisung, beispielsweise für eine Bewegtbild-Sequenz mit monotoner Zunahme in der Bild-Komplexität (beispielsweise ist der frühere Teil der Bewegtbild-Sequenz durch einfache Szenen gebildet, welche zur Enkodierung einfach sind, und der letzte Teil hat stufenförmig komplexere Szenen, welche zur Enkodierung schwierig sind).
  • Kodemengen, welche für einen solchen letzten Teil zuzuweisen sind, gehen jenseits einer Ziel-Kodemenge. Eine Verarbeitung einer übermäßigen zuzuweisenden Kodemenge (die Gesamtheit von Differenzen zwischen einer Ziel-Kodemenge und jeder erzeugten Kodemenge) für die einfachen Szenen, welche einfach zu enkodieren sind, verringert abrupt zuzuweisende Kodemengen, um eine Bild-Verschlechterung für insbesondere komplexe Szenen, welche schwierig zu enkodieren sind, verglichen mit einer Enkodierung mit einer fixierten Bitratensteuerung, zu bewirken.
  • Andererseits werden bei einer Bewegtbild-Sequenz mit dem früheren Teil von komplexen Szenen, welche schwierig zu enkodieren sind, und dem letzten Teil von Szenen, welche eine mittlere Bild-Komplexität haben, Kodemengen für den letzten Teil mit Bezug auf die Bild-Komplexität von dem früheren Teil zugewiesen.
  • Dies bewirkt eine Zuweisung von extrem kleinen Kodemengen an den letzten Teil von mittleren Szenen mit einer Bild-Verschlechterung, welches somit zu einer extrem kleineren Kodemenge, welche für die Bewegtbild-Sequenz erzeugt wird, führt, als eine Ziel-Kodemenge mit einer unwirksamen Verwendung eines Speichermediums.
  • Diese Technik ist dazu in der Lage, Kodemengen zuzuweisen, bei welcher, wenn eine zugewiesene Kodemenge kleiner als eine vorbestimmte Kodemenge, welche zuzuweisen ist, ist, das bav auf der Basis von einer aktuellen Speicherkapazität eines Speichermediums entschieden wird, wobei danach eine Kodemengen-Zuweisung jenseits des bav ermöglicht wird.
  • Dies erzielt eine Verbesserung in der subjektiven Bildqualität für eine Bewegtbild-Sequenz mit dem früheren Teil von einfachen Szenen, welche einfach zu enkodieren sind, und dem letzten Teil von komplexen Szenen, welche schwierig zu enkodieren sind.
  • Im Gegensatz dazu, ist bei einer Bewegtbild-Sequenz mit dem früheren Teil von komplexen Szenen, welche schwierig zu enkodieren sind, und dem letzten Teil von einfachen Szenen, welche einfach zu enkodieren sind, eine Verbesserung in der subjektiven Bildqualität für den früheren Teil unmöglich, und es wird eine übermäßige Kodemenge für den letzten Teil erzeugt, wenn eine Enkodierung vollständig ist, mit einer unwirksamen Verwendung eines Speichermediums.
  • Dokument EP0825782 offenbart eine Videodaten-Komprimierungseinrichtung. Eine Enkoder-Steuereinheit führt eine Vorverarbeitung zur Komprimierung und Kodierung durch, und erzeugt zur gleichen Zeit eine Ebenheit und Intra-AC-Parameter, welche die Schwierigkeit des Musters von Bildern anzeigen, welche auf I-Bilder zu komprimieren sind. Ein Bewegungserfasser berechnet eine Prädiktionsfehlermenge (ME-Rest) der Bewegungsprädiktion. Ein Host-Computer schätzt reale Schwierigkeits-Daten, welche die Schwierigkeit des Musters von jedem Bild anzeigen, durch den ME-Rest, die Ebenheit und das Intra-AC ab und berechnet ferner die Ziel-Datenmenge der komprimierten Videodaten von den abgeschätzten realen Schwierigkeits-Daten. Der Enkoder führt die Komprimierung und Kodierung derart durch, dass die Datenmenge der komprimierten Videodaten im Wesentlichen gleich der Ziel-Datenmenge wird.
  • UMRISS DER ERFINDUNG
  • Es ist eine Aufgabe der vorliegenden Erfindung, eine Einrichtung und ein Verfahren von einer Ein-Pass-Enkodierung mit variabler Bitratensteuerung bereitzustellen, um eine Echtzeit-Enkodierung und wirksame Kodemengen-Zuweisung mit einer kurzen Verzögerung in der Verarbeitung und einer kleinen Schaltung zu erzielen.
  • Es ist eine weitere Aufgabe der vorliegenden Erfindung, eine Einrichtung und ein Verfahren von einer Ein-Pass-Enkodierung mit variabler Bitratensteuerung bereitzustellen, um eine hohe Bildqualität einer Bewegtbild-Sequenz mit monotoner Zunahme in der Bild-Komplexität, welche höher als jene bei einer Enkodierung mit einer festgelegten Bitratensteuerung ist, zu erzielen, und um ebenfalls eine wirksame Kodemengen-Zuweisung zu erzielen.
  • Eine weitere Aufgabe der vorliegenden Erfindung liegt in der Bereitstellung von einer Einrichtung und einem Verfahren von einer Ein-Pass-Enkodierung mit variabler Bitratensteuerung, um eine wirksame Kodemengen-Zuweisung über die gesamte Bewegtbild-Sequenz für eine hohe Bildqualität zu erzielen.
  • Die vorliegende Erfindung stellt eine Einrichtung zum Enkodieren eingegebener Bewegtbilder mit einer Bewegungskompensations-Prädiktion bereit, wobei die Einrichtung enthält:
    einen Kodemengen-Erfasser zum Erfassen einer Kodemenge, welche für jedes enkodierte Bild der eingegebenen Bewegtbilder erzeugt ist;
    einen Faktor-Erfasser zum Erfassen eines mittleren Quantisierungs-Skalierungsfaktors aus Quantisierungs-Skalierungsfaktoren, welche zum Quantisieren der Bilder von den eingegebenen Bewegtbildern beim Enkodieren verwendet werden;
    einen Eigenschafts-Erfasser zum Erfassen von Bildeigenschaften von zumindest den eingegebenen Bewegtbildern;
    einen Berechner zum Berechnen, in Ansprechen auf die für jedes Bild erzeugte Kodemenge, den mittleren Quantisierungs-Skalierungsfaktor und die Bildeigenschaften, von einer Komplexität von jedem Bild; und
    eine Steuerung zum Entscheiden, in Ansprechen auf die für jedes Bild erzeugte Kodemenge, die Bildeigenschaften und die Komplexität von jedem Bild, von einer Kodemenge, welche einem zu enkodierenden vorliegenden Bild zuzuweisen ist, um einen Quantisierungs-Skalierungsfaktor für das vorliegende Bild zu erlangen; dadurch gekennzeichnet, dass
    der Berechner eine Komplexität des vorliegenden Bildes durch ein Berechnen der Komplexität von einem früheren Bild, welches jüngst vor dem vorliegenden Bild mit Bezug auf ein Produkt aus einer Multiplikation von der Kodemenge und dem mittleren Quantisierungs-Skalierungsfaktor bereits enkodiert ist, wobei das vorliegende und frühere Bild vom gleichen Bildtyp sind, und ein Multiplizieren von der Komplexität des früheren Bildes mit einem Verhältnis der Bildeigenschaften des vorliegenden Bildes zu den Bildeigenschaften des früheren Bildes berechnet.
  • Ferner stellt die vorliegende Erfindung ein Verfahren zum Enkodieren eingegebener Bewegtbilder mit einer Bewegungskompensations-Prädiktion bereit, wobei das Verfahren die Schritte enthält:
    Erfassen einer Kodemenge, welche für jedes enkodierte Bild der eingegebenen Bewegtbilder erzeugt wird;
    Erfassen eines mittleren Quantisierungs-Skalierungsfaktors aus Quantisierungs-Skalierungsfaktoren, welche zum Quantisieren der Bilder der eingegebenen Bewegtbilder beim Enkodieren verwendet werden;
    Erfassen von Bildeigenschaften von zumindest den eingegebenen Bewegtbildern;
    Berechnen einer Komplexität von jedem Bild in Ansprechen auf die für jedes Bild erzeugte Kodemenge, den mittleren Quantisierungs-Skalierungsfaktor und die Bildeigenschaften; und
    Entscheiden einer Kodemenge, welche einem zu enkodierenden vorliegenden Bild zuzuweisen ist, in Ansprechen auf die für jedes Bild erzeugte Kodemenge, die Bildeigenschaften und die Komplexität von jedem Bild, um einen Quantisierungs-Skalierungsfaktor für das vorliegende Bild zu erlangen, gekennzeichnet durch:
    Berechnen der Komplexität des vorliegenden Bildes durch ein Berechnen einer Komplexität von einem früheren Bild, welches jüngst vor dem vorliegenden Bild mit Bezug auf ein Produkt aus einer Multiplikation von der Kodemenge und dem mittleren Quantisierungs-Skalierungsfaktor bereits enkodiert ist, wobei das vorliegende und frühere Bild vom gleichen Bildtyp sind, und ein Multiplizieren von der Komplexität des früheren Bildes mit einem Verhältnis der Bildeigenschaften des vorliegenden Bildes zu den Bildeigenschaften des früheren Bildes.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 zeigt ein Blockdiagramm von einer Bewegtbild-Enkodierungs-Einrichtung als die erste bevorzugte Ausführungsform gemäß der vorliegenden Erfindung;
  • 2 zeigt ein Blockdiagramm von einer Bewegtbild-Enkodierungs-Einrichtung als die zweite bevorzugte Ausführungsform gemäß der vorliegenden Erfindung;
  • 3 zeigt ein Blockdiagramm von einem Bildeigenschafts-Erfasser der in 2 gezeigten Bewegtbild-Enkodierungs-Einrichtung.
  • GENAUE BESCHREIBUNG VON BEVORZUGTEN AUSFÜHRUNGSFORMEN
  • Es werden bevorzugte Ausführungsformen gemäß der vorliegenden Erfindung mit Bezug auf die anliegenden Zeichnungen beschrieben.
  • [Erste Ausführungsform]
  • Eine Bewegtbild-Enkodierungs-Einrichtung als die erste Ausführungsform gemäß der vorliegenden Erfindung wird mit Bezug auf 1 beschrieben.
  • Ein eingegebenes Bewegtbild wird durch einen Bildblockteiler (nicht gezeigt) in Makroblöcke geteilt, bevor es der Bewegtbild-Enkodierungs-Einrichtung zugeführt wird.
  • Für I-Bilder des eingegebenen Bewegtbildes werden eingegebene Bewegtbild-Makroblöcke einem Diskret-Kosinus-Umformer (DCT) 12 über einen Subtrahierer 11 ohne Bewegungskompensation zugeführt. Die umgeformten DCT-Koeffizienten werden durch einen Quantisierer 13 mit einem Quantisierungs-Skalierungsfaktor, welcher durch eine Kodemengen (CA)-Steuerung 14 zugeführt wird, quantisiert.
  • Die quantisierten DCT-Koeffizienten werden durch einen Variable-Länge (VL)-Enkoder 15 enkodiert und einem Puffer 16 zugeführt. Es werden kodierte Daten ausgegeben, nachdem die Kodemenge durch den Puffer 16 eingestellt ist.
  • Die quantisierten DCT-Koeffizienten werden ebenfalls einem D-Quantisierer 17 und einem Invers-DCT (IDCT) 18 zur lokalen Dekodierung zugeführt.
  • Die lokal dekodierten DCT-Koeffizienten werden in einem Rahmenspeicher 21 für jeden Makroblock über einen Addierer 20 ohne Hinzufügung der Ausgabe eines bewegungskompensierten (MC) Prädiktors 19 gespeichert.
  • Für P- und B-Bilder des eingegebenen Bewegtbildes werden eingegebene Bewegtbild-Makroblöcke und lokal dekodierte Makroblöcke, welche in dem Rahmenspeicher 21 gespeichert sind, dem MC-Prädiktor 19 zur Bewegungsvektor-Erfassung und Bewegungskompensation zugeführt. Die resultierenden Prädiktions-Makroblöcke werden von den eingegebenen Bewegtbild-Makroblöcken durch den Subtrahierer 11 zur Erzeugung von Prädiktionsfehler-Makroblöcken subtrahiert.
  • Die Prädiktionsfehler-Makroblöcke werden dann dem DCT 12 zugeführt.
  • Die verbleibende Prozedur ist gleich der für die I-Bilder. Die DCT-Koeffizienten der Prädiktionsfehler-Makroblöcke, welche von dem DCT 12 erlangt werden, werden durch den Quantisierer 13 mit einem Quantisierungs-Skalierungsfaktor quantisiert, welcher durch die CA-Steuerung 14 zugeführt wird.
  • Die quantisierten DCT-Koeffizienten der Prädiktionsfehler-Makroblöcke werden durch den VL-Enkoder 15 enkodiert und dem Puffer 16 zugeführt. Es werden kodierte Daten der Prädiktionsfehler-Makroblöcke ausgegeben, nachdem die Kodemenge durch den Puffer 16 eingestellt ist.
  • Die quantisierten DCT-Koeffizienten der Prädiktionsfehler-Makroblöcke werden ebenfalls dem D-Quantisierer 17 und dem IDCT 18 zur lokalen Dekodierung zugeführt.
  • Die lokal dekodierten DCT-Koeffizienten der Prädiktionsfehler-Makroblöcke werden in dem Rahmenspeicher 21 gespeichert, nachdem die Prädiktions-Makroblöcke von dem MC-Prädiktor 19 durch den Addierer 20 addiert sind.
  • Für die I-, P- und B-Bilder wird ein Quantisierungs-Skalierungsfaktor für jeden Makroblock durch den Quantisierer 13 einem Mittlerer-Quantisierungs-Skalierungsfaktor (AQSF)-Erfasser 22 zur Addition von Quantisierungs-Skalierungsfaktoren für einen Rahmen zugeführt, um einen mittleren Quantisierungs-Skalierungsfaktor für einen Rahmen zu berechnen.
  • Der Puffer 16 beobachtet stets die durch den VL-Enkoder 15 erzeugten Kodemengen, und es werden Kodemengen-Daten einem Kodemengen (CA)-Erfasser 23 zugeführt.
  • Der CA-Erfasser 23 addiert die Kodemengen-Daten für jeden Rahmen, um eine erzeugte Kodemenge für einen Rahmen zu erfassen.
  • Der mittlere Quantisierungs-Skalierungsfaktor und die erfasste Kodemenge werden einem Bild-Komplexität (PC)-Berechner 24 für jeden Rahmen zugeführt.
  • Die eingegebenen Bewegtbild-Makroblöcke werden ebenfalls einem Bildeigenschafts (PCH)-Erfasser 25 zugeführt, um eine Aktivität zu erfassen, welche ein Parameter ist, welcher Bildeigenschaften von jedem Makroblock darstellt. Die Aktivitäten werden miteinander für jeden Rahmen addiert, und die resultierenden Daten werden dem PC-Berechner 24 zugeführt.
  • Die Bildeigenschafts-Erfassung geht der Enkodierungs-Verarbeitung voraus. Der Parameter, welcher die Bildeigenschaften darstellt, ist vorzugsweise eine Verteilung aus Luminanzwerten oder eine Differenz zwischen Pixeln und dergleichen.
  • Der PC-Berechner 24 multipliziert den mittleren Quantisierungs-Skalierungsfaktor und die erfasste Kodemenge, wobei das Multiplikationsergebnis als eine Referenz nach einem Anlegen einer spezifischen Umwandlungsverarbeitung verwendet wird, um eine Bild-Komplexität für jeden Rahmen zu erlangen.
  • Ferner werden die Bild-Komplexitäten miteinander für eine vorbestimmte Zeitperiode für den jeweiligen Bildtyp (I, P und B) addiert, und das Additionsergebnis wird durch die Anzahl von Rahmen des gleichen Bildtyps für die gleiche vorbestimmte Periode geteilt, um eine mittlere Bild-Komplexität Xi-ave (I-Bild), Xp-ave (P-Bild) und Xb-ave (B-Bild) zu berechnen.
  • Die zuvor erwähnte vorbestimmte Zeitperiode entspricht vorzugsweise einer vorbestimmten spezifischen Anzahl von Rahmen von einem Bild, welches beispielsweise von soeben bis zurück zum 15. oder 300. Rahmen enkodiert wurde. Andererseits kann die Anzahl von Rahmen erhöht werden, beispielsweise von einem enkodierten Startrahmen zu einem Bild, welches soeben enkodiert wurde. Die spezifische Anzahl von Rahmen wird ebenfalls erhöht, wenn die Anzahl von enkodierten Rahmen für die vorbestimmte Zeitperiode kurz ist.
  • Die Verarbeitung bis hin zum Erlangen einer Bild-Komplexität von bereits enkodierten Bildern kann durch eine bekannte Technik durchgeführt werden. Jedoch ist es eines der Merkmale der vorliegenden Erfindung, dass die Bild-Komplexität von dem vorliegenden, zu kodierenden Bild, mittels einer Aktivität des vorliegenden Bildes abgeschätzt wird, welches detailliert diskutiert wird.
  • Bild-Komplexität Xi, Xp und Xb des vorliegenden, zu kodierenden Bildes werden wie folgt abgeschätzt: I-Bild Xi = Xi – p·(ACTi/ACTi – p) (1) P-Bild Xp = Xp – p·(ACTp/ACTp – p) (2) B-Bild Xb = Xb – p·(ACTb/ACTb – p) (3)wobei „i", „p" und „b" jeweils das I-, P- und B-Bild darstellen; ACTi, ACTp und ACTb die Aktivität des vorliegenden Bildes darstellen; Xi – p, Xp – p und Xb – p die Bild-Komplexität des gerade vor dem vorliegenden Bild, bei dem gleichen Bildtyp, enkodierten Bildes darstellen; und ACTi – p, ACTp – p und ACTb – p die Aktivität des gerade vor dem vorliegenden Bild, bei dem gleichen Bildtyp, enkodierten Bildes darstellen.
  • Wenn es keinen Rahmen gibt, welcher gerade vor dem vorliegenden Bild für den gleichen Bildtyp in der Anfangsstufe enkodiert ist, werden die Bild-Komplexität und Aktivität von mehreren Bildern von jedem Bildtyp gemäß einer mittleren Häufigkeit einer Erzeugung von Bewegtbildern erlangt und statistisch gemittelt. Der Ergebniswert kann als der Anfangswert verwendet werden.
  • Dieser Verarbeitung folgend, werden die mittlere Bild-Komplexität Xi – ave, Xp – ave und Xb – ave von jedem Bildtyp, und die abgeschätzte Bild-Komplexität Xi, Xp und Xb des vorliegenden, zu kodierenden Bildes, der CA-Steuerung 14 (1) zugeführt.
  • Die CA-Steuerung 14 führt eine Einstellung von einer Kodemenge, welche dem Bild zuzuweisen ist, welches von nun an zu kodieren ist, und eine Einstellung eines Quantisierungs-Skalierungsfaktors zur variablen Bitratensteuerung durch.
  • Eine mittlere, zuzuweisende Kodemenge Rave für eine Gruppe von Bildern (GOP), die Einheit zu kodierender Bilder, für gewöhnlich ein I-Bild-Intervall, können wie folgt erlangt werden: Rave = (Bitrate/Bildrate)·N (4)wobei die Bitrate eine Ziel mittlere Bitrate, die Bildrate die Anzahl von Rahmen pro Sekunde, und N die Anzahl von Rahmen von einem GOP darstellen.
  • Es wird angenommen, dass die Bild-Komplexität von jedem Bild von einer GOP, welche das vorliegende, zu kodierende Bild enthält, gleich der abgeschätzten Bild-Komplexität des vorliegenden Bildes ist, welche durch den PC-Berechner 24 erlangt wird, wenn Rave eine Kodemenge ist, welche zur Zuweisung an einer GOP notwendig ist, welche eine mittlere Bild-Komplexität hat.
  • Eine an eine GOP zuzuweisende, erforderliche Kodemenge Rc, um eine konstante Bildqualität zu erzielen, wird dann wie folgt erlangt: I-Bild Rc = Rave·(Xi/Xi – ave) (5) P-Bild Rc = Rave·(Xp/Xp – ave) (6) B-Bild Rc = Rave·(Xb/Xb – ave) (7)
  • Eine Ziel-Kodemenge für das vorliegende Bild, welches von nun an zu kodieren ist, kann mit einer Zuweisung von Rc an jedes Bild von einer GOP berechnet werden.
  • Im Folgenden wird eine Ziel-Kodemenge Zuweisungs-Verarbeitung im MPEG-Testmodell 5 als ein Beispiel diskutiert.
  • Ziel-Kodemengen, welche Ti, Tb und Tp für jeden Bildtyp zuzuweisen sind, werden durch die im Folgenden gezeigten Gleichungen (8), (9) und (10) erlangt.
  • In diesen Gleichungen ist MAX [A, B] ein Betrieb zum Auswählen von A oder B, welches größer als das andere ist; Np und Nb stellen jeweils die Anzahl von P- und B-Bilderrahmen dar; Kp und Kb stellen jeweils das Verhältnis des Quantisierungs-Skalierungsfaktors für P- und B-Bilderrahmen dar; ferner stellen Xi, Xp und Xb jeweils die Bild-Komplexität von I-, P- und B-Bildern dar, welche im MPEG-2-Testmodell 5 gerade vor den vorliegenden Bildern enkodiert wurden, jedoch können sie die Bild-Komplexität sein, welche für die vorliegenden Bilder abgeschätzt ist, welche von nun an enkodiert werden.
  • (I-Bild)
    • Ti = MAX[A, B] A = Rc/{1 + Np·Xp/(Xi·Kp) + Nb·Xb/(Xi·Kb)}; B = Bitrate/(8·Bildrate) (8)
  • (P-Bild)
    • Tp = MAX[C, D] C = Rc/{Np + Nb·Kp·Xb/(Kb·Xp)} D = Bitrate/(8·Bildrate) (9)
  • (B-Bild)
    • Tb = MAX[E, F] E = Rc/{Np + Nb·Kp·Xb/(Kb·Xp)} F = Bitrate/(8·Bildrate) (10)
  • Der Quantisierungs-Skalierungsfaktor für jeden Makroblock wird durch die MPEG2 Testmodell 5 Technik auf Basis der obigen Ziel-Kodemengen, welche zuzuweisen sind, und der Kodemenge, welche im Puffer 16 gespeichert ist, welche für jeden Makroblock erzeugt und durch den CA-Erfasser 23 erfasst wurde, entschieden.
  • Der PCH-Erfasser 25 führt die Aktivität für jeden Makroblock der CA-Steuerung 14 zur adaptiven Quantisierungs-Steuerung zu, um den Quantisierungs-Skalierungsfaktor für jeden Makroblock auf der Basis von der Aktivität im MPEG-Testmodell 5 einzustellen. Die adaptive Quantisierungs-Steuerung ist kein Muss, und die Quantisierungs-Skalierungsfaktor-Entscheidungsverarbeitung ist nicht auf die bislang diskutierte beschränkt.
  • Der Quantisierungs-Skalierungsfaktor für jeden durch die CA-Steuerung 14 erzeugten Makroblock wird dem Quantisierer 13 zugeführt, um das vorliegende Bild zu quantisieren, das heißt die DCT-Koeffizienten von einem Makroblock des eingegebenen Bildes (I-Bild) oder einem Prädiktionsfehler-Makroblock (P- oder B-Bild).
  • Das Quantisierungsergebnis wird durch den VL-Enkoder 15 enkodiert und ausgegeben, nachdem die Kodemenge durch den Puffer 16 eingestellt ist.
  • Der Quantisierungs-Skalierungsfaktor für jeden Makroblock wird vom Quantisierer 13 an den AQSF-Erfasser 22 zugeführt; und die Kodemenge im Puffer 16 wird dem CA-Erfasser 23 zur Kodemengen-Steuerungsverarbeitung für das nachfolgende Bild zugeführt.
  • [Zweite Ausführungsform]
  • Eine Bewegtbild-Enkodierungs-Einrichtung als die zweite bevorzugte Ausführungsform gemäß der vorliegenden Erfindung wird mit Bezug auf 2 offenbart.
  • Es werden Elementen in dieser Ausführungsform, welche gleich oder analog den Elementen in der ersten Ausführungsform sind, die gleichen Bezugszeichen gegeben und sie werden nicht detailliert erläutert.
  • Der Unterschied zwischen der ersten und zweiten Ausführungsform besteht darin, dass die letzte einen Bildeigenschafts (PCH)-Erfasser 25M hat, welcher ein bewegungskompensiertes Signal von einem bewegungskompensierten (MC) Prädiktor 19A empfängt.
  • Wie in 3 gezeigt, ist der PCH-Erfasser 25M mit einem ACTcur-Erfasser 25A, einem ACTpred-Erfasser 25B, einem ACTmv-Erfasser 25C und einem Bildaktivitäts (PA)-Berechner 25D bereitgestellt.
  • Wie bei der ersten Ausführungsform, wird ein eingegebenes Bewegtbild in Makroblöcke durch einen Bildblock-Teiler (nicht gezeigt) dividiert, bevor es der Bewegtbild-Enkodierungs-Einrichtung zugeführt wird.
  • Bei I-Bildern werden eingegebene Bewegtbild-Makroblöcke dem ACTcur-Erfasser 25A zur Erfassung von einer Aktivität (ACTcur) pro Makroblock für jeden Rahmen zugeführt. Die Aktivität ist ein Parameter, welcher die Bildeigenschaften darstellt. Der Parameter ist vorzugsweise eine Verteilung von Luminanzwerten oder eine Differenz zwischen Pixeln und dergleichen.
  • Die Aktivitäten von I-Bild-Makroblöcken, für welche eine bewegungskompensierte Prädiktion nicht erforderlich ist, werden miteinander für jeden Rahmen addiert, und das Additionsergebnis wird als I-Bild-Aktivität ACTi dem PC-Berechner 24 zugeführt.
  • Andererseits, bei P- und B-Bildern, außer einem eingegebenen Bewegtbild-Makroblock, sind Makroblöcke, welche dem PCH-Erfasser 25M zugeführt werden, ein Prädiktionsfehler Bild-Makroblock, welcher durch eine bewegungskompensierte Prädiktion erlangt wird, oder eine Makroblock-Differenz (zur Bewegungsvektor-Erfassung) zwischen dem eingegebenen Bewegtbild-Makroblock, welcher zu kodieren ist, und einem Referenzbild-Makroblock, und Bewegungsvektoren, welche für die bewegungskompensierte Prädiktion verwendet werden, von dem MC-Prädiktor 19A.
  • Wie bei den I-Bildern, wird die Aktivität ACTcur für jeden Makroblock durch den ACTcur-Erfasser 25A für eingegebene P- und B-Bilder erfasst.
  • Für den Prädiktionsfehler-Makroblock oder die Makroblock-Differenz wird eine Prädiktions-Aktivität ACTpred durch den ACTpred-Erfasser 25B unter Verwendung einer Summe von absoluten Fehlern oder einer Summe von Quadratfehlern von der Makroblock-Differenz erfasst.
  • Die Bewegungsvektoren, welche zur bewegungskompensierten Prädiktion verwendet werden, werden dem ACTmv-Erfasser 25C zugeführt, um den Absolutwert ACTmv der Differenz zwischen Vektorkomponenten in Makroblöcken angrenzend zueinander zu erlangen.
  • ACTmb wird dann durch die folgende Gleichung (11) für jeden Makroblock erlangt. ACTmb = a·ACTcur + b·ACTpred + c·ACTmv (11)
  • Die Konstanten „a", „b" und „c" werden gemäß dem Bildtyp oder dem Makroblock-Prädiktionstyp ausgewählt, nämlich Intra-Prädiktion, unidirektionale Prädiktion oder bidirektionale Prädiktion.
  • Zur Intra-Prädiktion, wird Null für beide Konstanten „b" und „c" ausgewählt, weil P- und B-Bilder nicht der Prädiktion unterworfen werden, gleich den I-Bildern; und es wird ein hoher Wert als die Konstante „a" ausgewählt, weil mehr Kode für P- und B-Bild-Makroblöcke erzeugt wird als für jene, welche der unidirektionalen oder bidirektionalen Prädiktion unterworfen werden.
  • Die Aktivitätserfassungs-Verarbeitung gemäß dem Bildtyp oder dem Makroblock-Prädiktionstyp in der zweiten Ausführungsform erzielt eine Bild-Komplexität-Abschätzung, welche mit den Enkodierungs-Eigenschaften mehr übereinstimmt als bei der ersten Ausführungsform.
  • Wie bereits offenbart, erzielt die erste Ausführungsform die mittlere Bild-Komplexität, welche erforderlich ist, um die Kodemenge Rc zu erlangen, welche einer GOP gemäß dem zu kodierenden Bildtyp zuzuweisen ist.
  • Nicht nur dadurch, kann die Kodemenge Rc unter Verwendung der folgenden Gleichung (12) erlangt werden: Rc = Rave·(Xk/X – ave) (12)wobei Rave die zuzuweisende mittlere Kodemenge darstellt, X – ave die mittlere Bild-Komplexität darstellt, welche erlangt wird, indem die Bild-Komplexität von jedem Rahmen innerhalb einer vorbestimmten Periode, ohne Bezug auf den Bildtyp, addiert wird, und das Additionsergebnis durch die Anzahl von Rahmen innerhalb der vorbestimmten Periode dividiert wird, und „k" = i, p oder b ist.
  • Die Gleichung (12) kann bei der zweiten Ausführungsform angewendet werden.
  • Die erste und zweite Ausführungsform ist mit drei Bildtypen, nämlich I-, P- und B-Bildern, offenbart. Nicht nur damit, können zwei Typen, beispielsweise I- und P-Bilder oder I- und B-Bilder, und ebenfalls lediglich die I-Bilder, welche frei von bewegungskompensierter Prädiktion sind, bei der ersten und zweiten Ausführungsform angewendet werden.
  • Die Anwendung von lediglich I-Bildern bei der zweiten Ausführungsform ist gleich der ersten Ausführungsform, weil die Eingabe an den PCH-Erfasser 25M lediglich eingegebene I-Bild-Makroblöcke sind.

Claims (7)

  1. Einrichtung zum Enkodieren eingegebener Bewegtbilder mit einer Bewegungskompensations-Prädiktion, wobei die Einrichtung enthält: einen Kodemengen-Erfasser zum Erfassen einer Kodemenge, welche für jedes enkodierte Bild der eingegebenen Bewegtbilder erzeugt ist; einen Faktor-Erfasser zum Erfassen eines mittleren Quantisierungs-Skalierungsfaktors aus Quantisierungs-Skalierungsfaktoren, welche zum Quantisieren der Bilder von den eingegebenen Bewegtbildern beim Enkodieren verwendet werden; einen Eigenschafts-Erfasser zum Erfassen von Bildeigenschaften von zumindest den eingegebenen Bewegtbildern; einen Berechner zum Berechnen, in Ansprechen auf die für jedes Bild erzeugte Kodemenge, den mittleren Quantisierungs-Skalierungsfaktor und die Bildeigenschaften, von einer Komplexität von jedem Bild; und eine Steuerung zum Entscheiden, in Ansprechen auf die für jedes Bild erzeugte Kodemenge, die Bildeigenschaften und die Komplexität von jedem Bild, von einer Kodemenge, welche einem zu enkodierenden vorliegenden Bild zuzuweisen ist, um einen Quantisierungs-Skalierungsfaktor für das vorliegende Bild zu erlangen; wobei der Berechner eine Komplexität des vorliegenden Bildes durch ein Berechnen der Komplexität von einem früheren Bild, welches jüngst vor dem vorliegenden Bild mit Bezug auf ein Produkt aus einer Multiplikation von der Kodemenge und dem mittleren Quantisierungs-Skalierungsfaktor bereits enkodiert ist, wobei das vorliegende und frühere Bild vom gleichen Bildtyp sind, und ein Multiplizieren von der Komplexität des früheren Bildes mit einem Verhältnis der Bildeigenschaften des vorliegenden Bildes zu den Bildeigenschaften des früheren Bildes berechnet.
  2. Einrichtung zum Enkodieren von eingegebenen Bewegtbildern nach Anspruch 1, wobei die Steuerung die dem vorliegenden Bild zuzuweisende Kodemenge durch ein Multiplizieren eines Verhältnisses von der Komplexität des vorliegenden Bildes zu einer mittleren Komplexität von früheren Bildern, welche bei einer vorbestimmten Zeitperiode vor dem vorliegenden Bild bereits enkodiert sind, und einer mittleren zuzuweisenden Kodemenge, welche basierend auf einem Verhältnis von einer Ziel-Mittelbitrate und einer spezifischen Anzahl von Bildern der eingegebenen Bewegtbilder innerhalb der vorbestimmten Periode erlangt wird, entscheidet.
  3. Einrichtung zum Enkodieren von eingegebenen Bewegtbildern nach Anspruch 2, bei welcher der Berechner die mittlere Komplexität der früheren Bilder des gleichen Bildtyps wie das vorliegende Bild berechnet, und die mittlere zuzuweisende Kodemenge und ein Verhältnis der Komplexität des vorliegenden Bildes zu der mittleren Komplexität der früheren Bilder multipliziert, um die Kodemenge des vorliegenden Bildes zu entscheiden.
  4. Einrichtung zum Enkodieren eingegebener Bewegtbilder nach Anspruch 1, bei welcher der Eigenschafts-Erfasser ferner Bildeigenschaften von Bildern erfasst, welche durch die Bewegungskompensations-Prädiktion erzeugt sind.
  5. Einrichtung zum Enkodieren eingegebener Bewegtbilder nach Anspruch 4, bei welcher der Eigenschafts-Erfasser eine erste Aktivität der eingegebenen Bewegtbilder und eine zweite Aktivität der durch die Bewegungskompensations-Prädiktion erzeugten Bilder erfasst, wobei vorbestimmte unterschiedliche Konstanten jeweils mit der ersten und zweiten Aktivität multipliziert werden, wobei die konstant multiplizierte Aktivität miteinander addiert wird, um die Bildeigenschaften zu erfassen.
  6. Verfahren zum Enkodieren eingegebener Bewegtbilder mit einer Bewegungskompensations-Prädiktion, wobei das Verfahren die Schritte enthält: Erfassen einer Kodemenge, welche für jedes enkodierte Bild der eingegebenen Bewegtbilder erzeugt wird; Erfassen eines mittleren Quantisierungs-Skalierungsfaktors aus Quantisierungs-Skalierungsfaktoren, welche zum Quantisieren der Bilder der eingegebenen Bewegtbilder beim Enkodieren verwendet werden; Erfassen von Bildeigenschaften von zumindest den eingegebenen Bewegtbildern; Berechnen einer Komplexität von jedem Bild in Ansprechen auf die für jedes Bild erzeugte Kodemenge, den mittleren Quantisierungs-Skalierungsfaktor und die Bildeigenschaften; und Entscheiden einer Kodemenge, welche einem zu enkodierenden vorliegenden Bild zuzuweisen ist, in Ansprechen auf die für jedes Bild erzeugte Kodemenge, die Bildeigenschaften und die Komplexität von jedem Bild, um einen Quantisierungs-Skalierungsfaktor für das vorliegende Bild zu erlangen, welches ferner den Schritt enthält: Berechnen der Komplexität des vorliegenden Bildes durch ein Berechnen der Komplexität von einem früheren Bild, welches jüngst vor dem vorliegenden Bild mit Bezug auf ein Produkt aus einer Multiplikation von der Kodemenge und dem mittleren Quantisierungs-Skalierungsfaktor bereits enkodiert ist, wobei das vorliegende und frühere Bild vom gleichen Bildtyp sind, und ein Multiplizieren von der Komplexität des früheren Bildes mit einem Verhältnis der Bildeigenschaften des vorliegenden Bildes zu den Bildeigenschaften des früheren Bildes.
  7. Verfahren zum Enkodieren eingegebener Bewegtbilder nach Anspruch 6, bei welchem die Kodemenge und der mittlere Quantisierungs-Skalierungsfaktor erfasst werden, während die eingegebenen Bewegtbilder enkodiert werden, wobei andererseits die Bildeigenschaften erfasst werden, bevor die eingegebenen Bewegtbilder enkodiert werden.
DE60035740T 1999-06-22 2000-06-15 Vorrichtung und Verfahren zur Kodierung von Bewegtbildsignalen Expired - Lifetime DE60035740T2 (de)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP17515499 1999-06-22
JP17515499A JP3858520B2 (ja) 1999-06-22 1999-06-22 動画像符号化装置及びその方法
JP17809099A JP2001008215A (ja) 1999-06-24 1999-06-24 動画像符号化装置及びその方法
JP17809099 1999-06-24
JP19014399 1999-07-05
JP19014399A JP4362793B2 (ja) 1999-07-05 1999-07-05 動画像符号化装置及びその方法

Publications (2)

Publication Number Publication Date
DE60035740D1 DE60035740D1 (de) 2007-09-13
DE60035740T2 true DE60035740T2 (de) 2007-12-06

Family

ID=27324058

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60035740T Expired - Lifetime DE60035740T2 (de) 1999-06-22 2000-06-15 Vorrichtung und Verfahren zur Kodierung von Bewegtbildsignalen

Country Status (4)

Country Link
US (2) US6600783B1 (de)
EP (1) EP1063851B1 (de)
CN (1) CN1159916C (de)
DE (1) DE60035740T2 (de)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60035740T2 (de) * 1999-06-22 2007-12-06 Victor Company of Japan, Ltd., Yokohama Vorrichtung und Verfahren zur Kodierung von Bewegtbildsignalen
JP2002101417A (ja) * 2000-09-22 2002-04-05 Oki Electric Ind Co Ltd 動画像符号化方法および装置
JP4203707B2 (ja) * 2001-01-31 2009-01-07 日本電気株式会社 事前解析を用いた動画像符号化装置、動画像符号化方法、及びそのプログラム。
FI109634B (fi) * 2001-02-16 2002-09-13 Hantro Products Oy Menetelmä ja laite videokuvan koodaamiseksi
JP3641214B2 (ja) * 2001-02-28 2005-04-20 株式会社東芝 動画像符号化装置および動画像符号化方法
CA2345878A1 (en) * 2001-05-01 2002-11-01 Destiny Software Productions Inc. Multi media distribution method and system
JP4447805B2 (ja) * 2001-08-09 2010-04-07 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
JP4769392B2 (ja) * 2001-09-25 2011-09-07 キヤノン株式会社 信号処理装置
DE60206738D1 (de) * 2002-06-11 2005-11-24 St Microelectronics Srl Videokodierungsverfahren und -Vorrichtung mit variabler Bitrate
US7133448B2 (en) 2002-11-07 2006-11-07 Silicon Integrated Systems Corp. Method and apparatus for rate control in moving picture video compression
US7940843B1 (en) * 2002-12-16 2011-05-10 Apple Inc. Method of implementing improved rate control for a multimedia compression and encoding system
US7095784B2 (en) * 2003-04-14 2006-08-22 Silicon Intergrated Systems Corp. Method and apparatus for moving picture compression rate control using bit allocation with initial quantization step size estimation at picture level
JP2005203905A (ja) * 2004-01-13 2005-07-28 Sony Corp 画像符号化装置、画像符号化方法並びに画像符号化プログラム
CN1323556C (zh) * 2004-02-25 2007-06-27 凌阳科技股份有限公司 可节省暂存器的双向动态补偿方法
US7397855B2 (en) * 2004-04-14 2008-07-08 Corel Tw Corp. Rate controlling method and apparatus for use in a transcoder
US7577340B2 (en) * 2004-07-21 2009-08-18 Panasonic Corporation Device and method for recording real-time data
JP4257655B2 (ja) * 2004-11-04 2009-04-22 日本ビクター株式会社 動画像符号化装置
US8363717B2 (en) 2005-05-17 2013-01-29 Canon Kabushiki Kaisha Image processing apparatus
US7822117B1 (en) * 2005-09-30 2010-10-26 Ambarella, Inc. Video encoder rate control using bit usage measuring and allocating by macroblock classes
US20100166053A1 (en) * 2007-01-31 2010-07-01 Sony Corporation Information processing device and method
WO2009148076A1 (ja) 2008-06-05 2009-12-10 日本電信電話株式会社 映像符号量制御方法、映像符号量制御装置、映像符号量制御プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
EP2301251A4 (de) * 2008-06-25 2012-12-26 Ericsson Telefon Ab L M Zeilenevaluierungs-ratensteuerung
US8325227B2 (en) * 2008-07-15 2012-12-04 Aptina Imaging Corporation Method and apparatus for low cost motion detection
EP2200322A1 (de) * 2008-12-22 2010-06-23 Thomson Licensing Verfahren und Vorrichtung zur Bestimmung einer zur Codierung eines Blockbildes benötigten Bitrate
US20110310956A1 (en) * 2010-06-22 2011-12-22 Jian-Liang Lin Methods for controlling video decoder to selectively skip one or more video frames and related signal processing apparatuses thereof
US10085023B2 (en) 2011-10-05 2018-09-25 Texas Instruments Incorporated Systems and methods for quantization of video content
CN103517080A (zh) * 2012-06-21 2014-01-15 北京数码视讯科技股份有限公司 实时视频流编码器和实时视频流编码方法
US20170070734A1 (en) * 2015-09-03 2017-03-09 Kabushiki Kaisha Toshiba Coding apparatus, decoding apparatus, and video transmission system

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6563875B2 (en) * 1987-12-30 2003-05-13 Thomson Licensing S.A. Adaptive method of encoding and decoding a series of pictures by transformation, and devices for implementing this method
EP0559348A3 (de) * 1992-03-02 1993-11-03 AT&T Corp. Rateurregelschleifenprozessor für einen wahrnehmungsgebundenen Koder/Dekoder
FR2688958B1 (fr) * 1992-03-17 1997-06-27 Thomson Csf Procede de codage d'images bi-standard tres bas debit et codeur-decodeur pour la mise en óoeuvre de ce procede.
JP2950065B2 (ja) 1992-10-28 1999-09-20 日本ビクター株式会社 可変転送レート符号化装置
EP0595268B1 (de) * 1992-10-28 2001-03-21 Victor Company Of Japan, Limited Kodiervorrichtung und -verfahren mit variablen Übertragungsraten
US5861921A (en) * 1993-03-29 1999-01-19 Canon Kabushiki Kaisha Controlling quantization parameters based on code amount
BE1007490A3 (nl) * 1993-09-10 1995-07-11 Philips Electronics Nv Inrichting voor het overdragen van een pluraliteit van televisie signalen over een transmissie kanaal.
BE1007807A3 (nl) * 1993-11-30 1995-10-24 Philips Electronics Nv Inrichting voor het coderen van een videosignaal.
KR100213014B1 (ko) * 1994-03-15 1999-08-02 윤종용 동화상신호의 고능률 부호화를 위한 레이트 콘트롤 장치
JP2970417B2 (ja) * 1994-08-22 1999-11-02 日本電気株式会社 動画像符号化方式
DE69605523T2 (de) * 1995-04-25 2000-07-06 Koninkl Philips Electronics Nv Vorrichtung und verfahren zur kodierung von videobildern.
JP2907063B2 (ja) * 1995-05-24 1999-06-21 日本ビクター株式会社 総符号量制御を行なう動画像符号化装置
JP3353604B2 (ja) * 1995-08-09 2002-12-03 ソニー株式会社 動画像符号化方法及び装置、並びに信号記録媒体
ES2144848T3 (es) * 1996-03-02 2000-06-16 Thomson Brandt Gmbh Metodo y aparato para codificar o decodificar datos de video digital.
DE69738878D1 (de) * 1996-04-12 2008-09-11 Sony Corp Bildkodierung mit Pufferunterlaufvermeidung
BE1010193A3 (nl) * 1996-04-17 1998-02-03 Philips Electronics Nv Encodeer-inrichting voor het encoderen van een programma en opteken-inrichting.
US6337879B1 (en) * 1996-08-14 2002-01-08 Sony Corporation Video data compression apparatus and method of same
CN1155259C (zh) * 1996-11-26 2004-06-23 松下电器产业株式会社 运动图象可变比特率编码装置和编码方法
JP3872849B2 (ja) 1996-11-28 2007-01-24 松下電器産業株式会社 動画像符号化装置
US6961375B1 (en) * 1997-02-06 2005-11-01 Sony Corporation Picture coding device and method, picture transmitting device and method and recording medium
JP3588970B2 (ja) 1997-04-30 2004-11-17 ソニー株式会社 信号符号化方法、信号符号化装置、信号記録媒体及び信号伝送方法
JPH10336654A (ja) * 1997-06-02 1998-12-18 Nec Corp 画像符号化装置
US6266375B1 (en) * 1997-11-13 2001-07-24 Sony Corporation Method and apparatus for selecting a quantization table for encoding a digital image
US6037987A (en) * 1997-12-31 2000-03-14 Sarnoff Corporation Apparatus and method for selecting a rate and distortion based coding mode for a coding system
US6192154B1 (en) * 1998-01-26 2001-02-20 International Business Machines Corporation Two-pass encoding method of digital motion video sequences for constant-or variable bit rate
TW501022B (en) * 1998-03-16 2002-09-01 Mitsubishi Electric Corp Moving picture coding system
KR100304103B1 (ko) * 1998-05-29 2001-09-24 이계철 비트율이급변되는재양자화계단크기선택방법및그를이용한비트율제어방법
US6532262B1 (en) * 1998-07-22 2003-03-11 Matsushita Electric Industrial Co., Ltd. Coding method and apparatus and recorder
US6310915B1 (en) * 1998-11-20 2001-10-30 Harmonic Inc. Video transcoder with bitstream look ahead for rate control and statistical multiplexing
DE60035740T2 (de) * 1999-06-22 2007-12-06 Victor Company of Japan, Ltd., Yokohama Vorrichtung und Verfahren zur Kodierung von Bewegtbildsignalen

Also Published As

Publication number Publication date
CN1278692A (zh) 2001-01-03
EP1063851A2 (de) 2000-12-27
US6922442B2 (en) 2005-07-26
EP1063851B1 (de) 2007-08-01
US6600783B1 (en) 2003-07-29
US20030206584A1 (en) 2003-11-06
CN1159916C (zh) 2004-07-28
EP1063851A3 (de) 2004-03-03
DE60035740D1 (de) 2007-09-13

Similar Documents

Publication Publication Date Title
DE60035740T2 (de) Vorrichtung und Verfahren zur Kodierung von Bewegtbildsignalen
DE69826155T2 (de) Verfahren und Vorrichtung zur digitalen Videosignalfilterung und -kodierung
DE69831894T2 (de) Signalkodierung, -aufnahme und -übertragung
DE69815720T2 (de) Kodierung von bewegten bildern mit variabler bitrate in einem durchgang
DE69637335T2 (de) Bildsignalkodierungsmethode und -vorrichtung
DE69825811T2 (de) Kodiergerät und Kodierverfahren mit Bewegungskompensation für hocheffiziente Videokodierung durch selektive Auswahl von vergangenen Bewegungsvektoren statt Benutzung von Bewegungsvektoren abgeleitet von Bewegungsschätzung
DE69628935T2 (de) Vorrichtung und verfahren zur optimierung der bitratensteuerung in einem codierungssystem
DE10300048B4 (de) Verfahren und Vorrichtung zur Bildcodierung und -decodierung
DE69738494T2 (de) Videokodierungs- und Videodekodierungsvorrichtung
DE69735679T2 (de) Verfahren zur Bilddecodierung
DE60319239T2 (de) Bewegungsschätzung mit gewichteter vorhersage
DE69837003T2 (de) Vorrichtung und verfahren zur optimierung der bitratensteurung in einem kodiersystem
DE69813349T2 (de) Vorrichtung zur Kontrolle der Datenmenge und Kodierer dieselbige anwendend
DE69933483T2 (de) Vorrichtung und Verfahren zum Codieren mit bewegungskompensierter Vorhersage
DE69535228T2 (de) Bildumsetzungsvorrichtung
DE69830979T2 (de) Verfahren und vorrichtung zur videocodierung mit variabler bitrate
DE69815159T2 (de) Kodierung von bewegten bildern mit globaler konstanter bitrate
DE10253380B4 (de) Verfahren und Einrichtung zum Kodieren sich bewegender Bilder mit fester Rechenkomplexität
DE69635369T2 (de) Videokodierungsvorrichtung
DE69816875T2 (de) Sequenzadaptive bit-zuordnung zur codierung von bildern
DE69935564T2 (de) Kodiervorrichtung und -verfahren
DE19643915A1 (de) Verfahren und Schaltung zur Bestimmung eines Quantisierintervalls in einem Bildkodierer
DE69837361T2 (de) Verfahren und Vorrichtung zur Bildkodierung
DE4442643B4 (de) Verfahren zum Abschätzen der Bewegung in einem Bewegtbild
DE19743202B4 (de) Verfahren zum Codieren eines Bewegungsvektors

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Representative=s name: 2K PATENTANWAELTE BLASBERG KEWITZ & REICHEL, PARTN

R082 Change of representative

Ref document number: 1063851

Country of ref document: EP

Representative=s name: 2K PATENTANWAELTE BLASBERG KEWITZ & REICHEL, PARTN