DE69833004T2 - Verlustfreie kodierung eines interessierenden gebiets - Google Patents

Verlustfreie kodierung eines interessierenden gebiets Download PDF

Info

Publication number
DE69833004T2
DE69833004T2 DE69833004T DE69833004T DE69833004T2 DE 69833004 T2 DE69833004 T2 DE 69833004T2 DE 69833004 T DE69833004 T DE 69833004T DE 69833004 T DE69833004 T DE 69833004T DE 69833004 T2 DE69833004 T2 DE 69833004T2
Authority
DE
Germany
Prior art keywords
mask
interest
coefficients
setting
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69833004T
Other languages
English (en)
Other versions
DE69833004D1 (de
Inventor
David Nister
Charilaos Christopoulos
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE9703690A external-priority patent/SE512840C2/sv
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of DE69833004D1 publication Critical patent/DE69833004D1/de
Publication of DE69833004T2 publication Critical patent/DE69833004T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/127Prioritisation of hardware or computational resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Description

  • Technisches Gebiet
  • Die vorliegende Erfindung bezieht sich auf Verfahren und eine Vorrichtung für eine verlustfreie Kodierung eines interessierenden Bereiches bzw. Gebietes (ROI) bei einer Übermittlung eines stehenden Bildes. Das Verfahren und die Vorrichtung sind besonders gut geeignet für die S+P-Transformierung bzw. Transformation.
  • Hintergrund der Erfindung und Stand der Technik
  • Bei einer Übermittlung von digitalisierten stehenden Bildern von einem Übermittler an einen Empfänger ist das Bild gewöhnlicher Weise kodiert, um den Umfang von Bits zu vermindern, die für ein Übermitteln des Bildes erforderlich sind.
  • Der Grund zum Vermindern des Umfangs von Bits ist gewöhnlicherweise, dass die Kapazität des verwendeten Kanals begrenzt ist. Ein digitalisiertes Bild jedoch besteht aus einer sehr großen Anzahl von Bits. Wenn ein derartiges Bild, das aus einer sehr großen Anzahl von Bits besteht, über einen Kanal übermittelt wird, der eine begrenzte Bandbreite aufweist, werden Übermittlungszeiten für die meisten Anwendungen unakzeptierbar lang, wenn jedes Bit des Bildes übermittelt werden muss.
  • Daher betrafen in jüngsten Jahren viele Forschungsaufwendungen Kodierungsverfahren und Techniken für digitalisierte Bilder, mit dem Ziel die Anzahl von für ein Übermitteln notwendigen Bits zu vermindern.
  • Diese Verfahren können in zwei Gruppen geteilt werden:
    Verlustlose Verfahren, d.h. Verfahren, die die Redundanz in dem Bild auf eine derartige Weise ausnutzen, dass das Bild durch den Empfänger ohne jeglichen Verlust von Information rekonstruiert werden kann.
  • Verlustbehaftete Verfahren, d.h. Verfahren, die die Tatsache ausnutzen, dass alle Bits nicht gleich wichtig für den Empfänger sind, und somit das empfangene Bild nicht identisch mit dem Original ist, aber zum Beispiel für das menschliche Auge hinreichend so aussehen wie das Originalbild.
  • Ferner kann in einigen Anwendungen ein Teil eines übermittelten Bildes interessanter sein als der Rest des Bildes und eine bessere visuelle Qualität dieses Teils des Bildes daher gewünscht sein. Dieser Teil wird gewöhlicherweise als interessierender Bereich (ROI) bezeichnet. Eine Anwendung, in der dies nützlich sein kann, ist beispielsweise in medizinische Datenbasen. In einigen Fällen ist es auch gewünscht oder erforderlich, dass der interessierende Bereich verlustlos übermittelt wird, während die Qualität des Restes des Bildes von geringerer Wichtigkeit ist.
  • Ein Verfahren, das zum Kodieren von feststehenden Bildern verwendet werden kann, ist die wellenbasierte S+P-Transformation. Die S+P-Transformation ist vollständig reversibel und kann direkt ohne Speichererweiterung durchgeführt werden. Die S+P-Transformation wird in A. Said und W. A. Pearlmann beschrieben, „Reversible image compression via multiresolution representation and predictive coding", in Proc. SPIE Conf. Visual Communications and Image Processing '93, Cambridge, MA, Nov. 1993, Proc. SPIE 1094, Seiten 664-674.
  • Sie besteht aus der S-Transformation, siehe V. K. Heer and H-E. Reinfelder, „ A comparison of reversible methods for data compression", Proc. SPIE, vol 1233 Med. Imag. IV, Seiten 359- 365, 1990, die eine Pyramidenunterbandzerlegung ist, und einer Vorhersage, die verwendet wird, um die verbleibenden Redundanzen aus den Hochfrequenzunterbändern herauszunehmen. Die vorwärtige Transformation wird durchgeführt durch mehrmaliges Anwenden einer Unterbandzerlegung. Die Inverse wird gefunden durch Anwenden der entsprechenden Zerlegungen in umgekehrter Reihenfolge.
  • In J. Ström, P. C. Cosman, „Medical image compression with lossless regions of interest", Signal Processing 59, Nr. 2, Jun. (1997) 155-171 ist beschrieben, wie ein verlustloser interessierender Bereich für die S-Transformierte berechnet werden kann.
  • Wenn jedoch versucht wird eine derartige Technik auf die wellenbasierte S+P-Transformierte anzuwenden, d.h. eine verlustlose Übermittlung des interessierenden Bereiches und eine verlustbehaftete Übermittlung des Restes des Bildes, kann keine direkte vorwärtige Technik verwendet werden.
  • Somit besteht heute keine Möglichkeit für eine verlustlose Kodierung eines interessierenden Bereiches eines S+P transformierten Bildes. Dies ist infolge der Tatsache, dass es nicht leicht ist, die Information in dem S+P transformationscodierten Originalbild auszuwählen, das übermittelt werden soll, um eine perfekte verlustlose Rekonstruktion des interessierenden Bereiches zu erhalten, ohne das gesamte Bild verlustlos übertragen zu müssen
  • Zusammenfassung
  • Es ist eine Aufgabe der vorliegenden Erfindung das Problem zu lösen, wie die Daten in einem S+P transformierten Bild ausgewählt werden, um einen verlustlosen interessierenden Bereich in einem Empfänger zu erhalten.
  • Diese Aufgabe wird gelöst mittels Berechnen einer Maske für den interessierenden Bereich, wie unten beschrieben wird.
  • Somit müssen Bits durch Senden von weniger Information über den Hintergrund oder des nicht interessierenden Teils des Bildes gespeichert werden, oder wenigstens mit dieser Information abgewartet werden, bis zu einem späteren Zustand in der Übermittlung, um einen perfekt rekonstruierten interessierenden Bereich zu erhalten, während ein klarer Umfang einer Kompression beibehalten wird.
  • Um dies auszuführen, wird eine verlustlose Maske berechnet. Die Maske ist eine Bitebene, die anzeigt, welche Wellenkoeffizienten exakt übermittelt werden müssen, wenn der Empfänger in der Lage sein soll den gewünschten Bereich perfekt zu rekonstruieren. In dem Fall, dass ein ROI in dem Bild ausgewählt wird verlustlos zu sein, sollte ein A-Vorhersager, der in der oben bezuggenommenen S+P-Transformierten verwendet wird, verwendet werden.
  • Dieses wird gemacht, weil, wenn der A-Vorhersager verwendet wird, keine Vorhersage von hohen Frequenzen mit der Hilfe von hohen Frequenzen durchgeführt wird. Wenn dies der Fall war, wie in dem C-Vorhersagerfall, siehe Bezugnahme oben, könnte sich ein möglicher Fehler über den ganzen Weg von der Kante des Bildes ausbreiten und auch innerhalb des ROI, und es unmöglich machen, einen verlustlosen ROI bereitzustellen.
  • Die Maske wird unter Verfolgen dergleichen Schritte wie die vorwärtige S+P-Transformierten berechnet, d.h. Verfolgen der inversen Transformierten rückwärts. Begonnen wird damit, dass die Maske eine binäre Karte des ROI ist, so dass eins innerhalb des ROI ist und null außerhalb. In jedem Schritt wird dann Zeile für Zeile aktualisiert und dann Spalte für Spalte. In jedem Schritt wird die Maske aktualisiert, so dass angezeigt wird, welche Koeffizienten exakt in diesem Schritt benötigt werden für die inverse S+P, um die Koeffizienten der vorhergehenden Maske exakt zu reproduzieren.
  • Der letzte Schritt der inversen S+P ist eine Zusammensetzung von zwei Unterbändern. Zum Rückwärtsverfolgen dieses Schrittes werden die Koeffizienten in den zwei Unterbändern gefunden, die exakt benötigt werden. Der vorletzte Schritt ist eine Zusammensetzung von vier Unterbändern in zwei. Um diesen Schritt rückwärts zu verfolgen, werden die Koeffizienten in den vier Unterbändern gefunden, die benötigt werden, um eine perfekte Rekonstruktion der Koeffizienten zu ergeben, die in der Maske für zwei Unterbänder eingeschlossen sind.
  • Alle Schritte werden dann rückwärts verfolgt, um eine Maske zu ergeben, die das folgende implizieren:
    Wenn die Koeffizienten entsprechend der Maske exakt übermittelt und empfangen werden, und die inverse S+P (mit dem A-Vorhersager) auf diesen berechnet werden, wird der gewünschte ROI perfekt rekonstruiert.
  • Um einen Schritt rückwärts auf einer separaten Zeile zu verfolgen, in der Xm(n) die Maske vor der Schrittumkehrung ist, Lm(n) und Hm(n) die Maske für das Nieder- und Hochfrequenzunterband danach sind, werden die folgenden Schritte ausgeführt:
    Für die S+P mit einem A-Vorhersager:
    Figure 00050001
    Hm(n) = 1 Wenn {Xm(2n) = 1} ODER {Xm(2n + 1) = 1}, andernfalls 0 Lm(n) = 1 Wenn {Xm(2n – 2) = 1} ODER {Xm(2n – 1) = 1} ODER {Xm(2n) = 1} ODER {Xm(2n + 1) =1} ODER {Xm(2n + 2) = 1} ODER {Xm(2n + 3) = 1}, andernfalls 0 Somit wird die binäre Maske für das Niederfrequenzunterband und das Hochfrequenzunterband entsprechend auf eine Binäre gesetzt, d.h. der entsprechende Koeffizient wird übermittelt, um einen verlustlosen interessierenden Bereich zu erhalten, wenn die obigen Bendingungen erfüllt sind.
  • Für eine Synchronisierung wird die gleiche Maske in sowohl dem Kodierer als auch dem Dekodierer gefunden. Nach einem gewissen Zustand, kann ein Überspringen eingeschaltet werden und Hintergrundlisteneinträge erfasst werden. Dies sind die, die Sätzen entsprechen, die keine Koeffizienten enthalten, die angezeigt sind für eine exakte Übermittlung durch die verlustlose Maske.
  • Die Hintergrundlisteneinträge können dann vollständig übersprungen werden, in eine Warteliste für eine spätere Verbesserung gegeben werden oder eine geringere Priorität in einigen Arten von Verschachtelungsschemen gegeben werden.
  • Ferner muss die Form des ROI nicht vor der Übermittlung definiert werden und kann daher entweder durch den Übermittler oder den Empfänger zu jedem Zustand der Übermittlung spezifiziert werden.
  • Der ROI kann auch durch zwei oder mehrere Teile gebildet werden, die nicht miteinander in Verbindung stehen. Die Technik wird dann auf die gleiche Weise angewendet.
  • Kurze Beschreibung der Zeichnungen
  • Die vorliegende Erfindung wird nun detaillierter mittels nicht einschränkenden Beispielen und mit Bezugnahme auf die beigefügten Zeichnungen beschrieben, in denen:
  • 1 ein allgemeines Übermittlungssystem ist, das die S+P-Transformierte verwendet.
  • 2a und 2b Flussdiagramme sind, die verschiedene Schritte darstellen beim Kodieren des interessierenden Bereiches für ein S+P transformiertes feststehendes Bild.
  • 3a bis 3e Darstellungen der Berechnung einer verlustlosen Maske für verschiedene Unterbandstufen sind.
  • Beschreibung der bevorzugten Ausführungsformen
  • In 1 ist ein allgemeines Übermittlungssystem gezeigt, das die S+P-Transformierte verwendet. Das System umfasst einen S+p-Kodiererblock 101, der mit einem ROI-Kodierungsblock 103 verbunden ist. Der S+P-Block 101 kodiert ein Eingangsbild gemäß der oben bezuggenommenen S+P-Transformierten. Der Kodierer 101 kann Information bezüglich eines besonderen Teils des Bildes empfangen, der interessiert, d.h. des interessierenden Bereiches (ROI), von einem Empfänger oder Dekodierer 107 über einen Kanal 105.
  • Die Information wird dann an den ROI-Block 103 weitergeleitet, der die Koeffizienten des S+P-transformierten Bildes berechnet, das übermittelt werden soll, um dem Dekodierer 107 mit einem verlustlosen interessierenden Bereich zu versorgen. Der Dekodierer 107 ist mit einem Block 109 verbunden, in dem entsprechende ROI-Dekodierung durchgeführt werden kann.
  • In 2a und 2b sind verschiedene Flussdiagramme gezeigt, die die verschiedenen Schritte darstellen, die in dem ROI-Block 103 in 1 ausgeführt werden, beim Berechnen des interessierenden Bereiches für ein S+P transformiertes feststehendes Bild.
  • Somit wird in dem ROI-Block 103 in 1 die folgende Kodierung ausgeführt. Als erstes startet in einem Block 201 ein Kodierungsprozess. Dann wird in Block 203 die Berechnung einer ROI-Maske initiiert. Darauf wird in einem Block 205 die horizontale Unterbandlänge gleich der horizontalen Bildgröße und die vertikale Unterbandlänge gleich der vertikalen Bildgröße gesetzt.
  • Als nächstes wird in Block 207 die erste Unterbandebene entsprechend der ersten Ebene der Transformierten, dass ist die höchste Frequenzoktave von Bändern, betrachtet, und die Prozedur fährt mit einem Block 209 fort, in dem die erste horizontale Zeile betrachtet wird. Danach wird in einem Block 211 die horizontale Zeile aktualisiert. Die Aktualisierungsprozedur wird detaillierter unten in Verbindung mit 2b beschrieben.
  • Als nächstes wird in Block 213 die horizontale Zeilenanzahl um eins erhöht, und dann in Block 215 geprüft, ob die horizontale Zeilenanzahl kleiner oder gleich der vertikalen Unterbandlänge ist. Wenn das der Fall ist; kehrt der Prozess zu Block 211 zurück, andernfalls fährt er mit einem Block 217 fort.
  • In dem Block 217 wird eine erste vertikale Zeilenanzahl betrachtet. Als nächstes wird in einem Block 219 die vertikale Zeilenanzahl gemäß der unten in Verbindung mit 2b beschriebenen Prozedur aktualisiert.
  • Darauf wird in Block 221 die vertikale Zeilenanzahl um eins erhöht, und als nächstes in Block 223 wird geprüft, ob die vertikale Zeilenanzahl kleiner oder gleich der vertikalen Unterbandlänge ist. Wenn das der Fall ist kehrt der Prozess zu dem Block 219 zurück, andernfalls fährt er mit einem Block 225 fort.
  • In dem Block 225 werden sowohl die horizontale Unterbandlänge als auch die vertikale Unterbandlänge beide durch zwei geteilt. Darauf wird in Block 227 geprüft, ob dies die letzte Ebene war. Wenn dies der Fall war, fährt der Prozess mit einem Block 229 fort, in dem der Prozess stoppt, und andernfalls fährt er zu Block 209 zurück.
  • In 2b wird die in dem Block 211 und 219 in 2a ausgeführte Prozedur detaillierter beschrieben. Somit startet die Prozedur in Block 251. Dann wird in einem Block 253 ein Parameter n entsprechend der Ordnungszahl in der zu aktualisierenden Zeile auf null gesetzt. Als nächstes wird in einem Block 255 bewertet, ob die Koeffizientenzahl n in der zu aktualisierenden Zeile zum Erhalten eines verlustlosen ROI erforderlich ist, weil es erforderlich ist für die Vorhersage der Koeffizienten (2n – 2), (2n – 1), (2n), (2n + 1), (2n + 2) und (2n + 3).
  • Dann fährt die Prozedur fort, wenn die Maske vor der Schrittumkehrung eine Binäre ist für (2n – 2), (2n – 1), (2n), (2n + 1), (2n + 2) oder (2n + 3), und andernfalls fährt sie mit einem Block 259 fort. In dem Block 257 wird der Koeffizient n in der derzeit aktualisierten Zeile auf eine binäre eins (EIN) gesetzt, d.h. der Koeffizient wird benötigt zum Erhalten eines verlustlosen ROI, und in dem Block 259 wird der Koeffizient n in der derzeit aktualisierten Zeile auf eine binäre null (AUS) gesetzt. Als nächstes fährt die Prozedur von den Blöcken 257 bzw. 259 fort mit einem Block 261.
  • In dem Block 261 wird geprüft, ob die Koeffizientennummer (n + m/2) zum Erhalten eines verlustlosen ROI benötigt wird, wobei m die Länge der derzeit aktualisierten Zeile ist. Wenn die Bewertung in Block 261 in einem Ja resultiert, fährt die Prozedur mit einem Block 263 fort, andernfalls fährt die mit einem Block 265 fort.
  • In dem Block 263 wir die Koeffizientenzahl (n + m/s) in der derzeit aktualisierten Zeile auf eine Binäre eins (EIN) gesetzt, und die Prozedur fährt dann mit einem Block 267 fort. In dem Block 265 wird die Koeffizientenzahl (n + m/s) in der derzeit aktualisierten Zeile auf eine Binäre null (AUS) gesetzt, und die Prozedur fährt dann mit dem Block 267 fort.
  • In dem Block 267 wird n um eins erhöht, und die Prozedur fährt dann mit einem Block 268 fort. In dem Block 269 wird geprüft, ob n kleiner als die Zeilenlänge geteilt durch 2 ist, d.h., wenn n < m/2 ist. Wenn das der Fall ist, kehrt die Prozedur zu dem Block 255 zurück, andernfalls fährt die Prozedur mit einem Block 271 fort, in dem die Prozedur stoppt.
  • Das Verfahren zum Berechnen der verlustlosen Maske für den interessierenden Bereicht kann auch ausgedrückt werden als ein Pseudocode, wie unten gezeigt ist.
  • Figure 00100001
  • Figure 00110001
  • In 3a3e sind die Binärbitmasken gezeigt, die für verschiedene Ebenen oder Stufen erhalten werden. Somit ist in 3a die Maske des gewünschten ROI in der Bildebene gezeigt, z.B. der Bereich, der von dem Empfänger an den Übermittler in der obigen Beschreibung übermittelt wird.
  • In 3b ist die Binärmaske für die Koeffizienten gezeigt, die in der zweiten Unterbandstufe benötigt werden.
  • In den 3c bis 3e sind die entsprechenden Masken für die vierten, fünften und siebten Unterbandstufen entsprechend gezeigt.
  • In einer anderen bevorzugten Ausführungsform ist die Vorhersage ausgeweitet zum Verwenden der Niederfrequenzkoeffizienten L(n – 2), L(n – 1), L(n), L(n + 1), L(n + 2). Die Vorhersage ist daher: P(n) = an-2·L(n – 2) + an-1·L(n – 1) + an·L(n) + an+1·L(n + 1) + an+2·L(n + 2) + a0
  • Wenn zum Beispiel die Koeffizient sind: an-2 = –3/64 an-1 = 22/64 an = 0 an+2 = 3/64 a0 = –32/64ist der Filter identisch zu der Zwei-Zehn-Transformierten, die in der CREW verwendet wird, wie beschrieben in RICOH CREW Image Compression Standard Version 0.11 (Draft 11), 24. Oktober 1997, RICOH Silicon Valley, Inc. Wenn die Koeffizienten an-2 und an+2 gleich null sind, wird der Vorhersager ein A-Vorhersager sein. Vorhersager, die mehr Koeffizienten verwenden, sind auch möglich.
  • Die Maske, die durch eine rückwärtige Verfolgung gefunden wird, wird nun leicht ausgeweitet. Zum Verfolgen eines rückwärtigen Schrittes auf einer separaten Zeile in diesem Fall, wo Xm(n) die Maske vor der Schrittumkehrung ist, Lm(n) und Hm(n) die Masken für das Nieder- und Hochfrequenzunterband nachfolgend sind, werden die folgenden Regeln angewendet:
    Für den ausgeweiteten Vorhersager:
    Figure 00130001
    Hm(n) = 1 Wenn {Xm(2n) = 1} ODER {Xm(2n + 1) = 1}, andernfalls 0 Lm(n) = 1 Wenn {Xm(2n – 4) = 1} ODER {Xm(2n – 3) = 1} ODER {Xm(2n – 2) = 1} ODER {Xm(2n – 1) = 1} ODER {Xm(2n) = 1} ODER {Xm(2n + 1) = 1} ODER {Xm(2n + 2) = 1} ODER {Xm(2n + 3) = 1} ODER {Xm(2n + 4) = 1} ODER {Xm(2n + 5) = 1}, andernfalls 0
  • Einfache Pseudocodes zum Berechnen der ausgeweiteten Maske werden unten gezeigt.
  • Figure 00130002
  • Figure 00140001
  • Es ist auch möglich die Form, Größe und Stelle des interessierenden Bereiches während einer Übermittlung zu verändern, beim Verwenden des Verfahrens und einer Vorrichtung wie hierin beschrieben. Die einzigen Schritte, die durchgeführt werden müssen, sind eine Übermittlung einer Anfrage für einen anderen interessierenden Bereich von dem Empfänger an den Übermittler, der dann eine neue Maske entsprechend des neuen interessierenden Bereiches berechnet, und dann Übermitteln der Koeffizienten entsprechend dieser neuen Maske an den Empfänger. Die Anfrage für einen anderen interessierenden Bereich kann auch durch eine andere Quelle erzeugt werden als ein Empfänger, zum Beispiel ein Programm in dem Übermittler.
  • Eine derartige Funktion kann in vielen Anwendungen sehr hilfreich sein. Es ist beispielsweise nicht immer so, dass der Empfänger den interessierenden Bereich empfängt, den er/sie wünscht. In diesem Fall kann er/sie eine Anfrage für einen größeren interessierenden Bereich oder selbst einen vollständig verschiedenen interessierenden Bereich übermitteln.
  • Daher wird der Übermittler in einer bevorzugten Ausführungsform mit Mitteln zum Empfangen eines neuen interessierenden Bereiches bereitgestellt von beispielsweise einem Empfänger während einer Übermittlung eines Bildes, und zum Berechnen einer Maske entsprechend eines derartigen neuen interessierenden Bereiches. Ein neuer interessierender Bereich kann dann von dem Übermittler an den Empfänger übermittelt werden.
  • Somit wurde ein Verfahren und eine Vorrichtung zum Übermitteln von S+P transformierten kodierten digitalisierten Bildern beschrieben, unter Verwendung einer Maske mittels der ein interessierender Bereich (ROI) verlustlos übermittelt werden kann ohne den verbleibenden Teil des digitalisierten Bildes übermitteln zu müssen. Die Verwendung macht es möglich, den ROI verlustlos zu übermitteln und zu empfangen, und noch ein gutes Komprimierungsverhältnis für das Bild als ganzes zu erhalten. Dies ist möglich, da kein oder nur wenige Bits für den verbleibenden Teil des Bildes verwendet werden können.
  • Ferner kann eine gemäß den hierin beschriebenen Prinzipien berechnete Maske verwendet werden zum Übermitteln der zum Erhalten eines verlustlosen ROI erforderlichen Koeffizienten zu jeder Zeit während der Übermittlung.

Claims (10)

  1. Ein Verfahren zum verlustlosen Übermitteln eines interessierenden Bereiches eines S+P transformationscodierten digitalisierten Bildes, dadurch gekennzeichnet, dass eine Maske berechnet wird, die die Koeffizienten des S+P transformierten Bildes anzeigt, das dem interessierenden Bereich entspricht, und dessen Koeffizienten übermittelt werden.
  2. Verfahren gemäß Anspruch 1, dadurch gekennzeichnet, dass die Koeffizienten des S+P transformierten Bildes entsprechend dem interessierenden Bereich in den frühen Stufen der Übermittlung übermittelt werden, um einen verlustlosen interessierenden Bereich in einem Empfänger und ein verlustbehaftetes verbleibendes Bild zu erhalten.
  3. Verfahren gemäß einem der Ansprüche 1 – 2, dadurch gekennzeichnet, dass die Maske durch Verfolgen eines Rückwärtsschrittes auf einer separaten Zeile erhalten wird, und dass die folgenden Schritte ausgeführt werden: – Einstellen von Hm(n) = 1 Wenn {Xm(2n) = 1} ODER {Xm(2n + 1) = 1}, und andernfalls 0 – Einstellen von Lm(n) = 1 Wenn {Xm(2n – 2) = 1} ODER {Xm(2n – 1) = 1} ODER {Xm(2n) = 1} ODER {Xm(2n + 1) =1} ODER {Xm(2n + 2) = 1} ODER {Xm(2n + 3) = 1}, und andernfalls 0 für alle n in
    Figure 00170001
    wobei Xm(n) die Maske vor dem Umkehrungsschritt ist, Lm(n) und Hm(n) die Masken nachher sind für das Nieder- und Hochfrequenzunterband, und wobei n die Nummer eines Koeffizienten in einer Zeile ist, die aktualisiert wird.
  4. Ein Verfahren gemäß einem der Ansprüche 1 – 2, dadurch gekennzeichnet, dass die Maske durch Verfolgen eines Rückwärtsschrittes auf einer separaten Zeile erhalten wird, und dass dann die folgenden Schritte ausgeführt werden: – Einstellen von Hm(n) = 1 Wenn {Xm(2n) = 1} ODER {Xm(2n + 1) = 1}, und andernfalls 0 – Einstellen von Lm(n) = 1 Wenn {Xm(2n – 4) = 1} ODER {Xm(2n – 3) = 1} ODER {Xm(2n – 2) =1} ODER {Xm(2n – 1) =1} ODER {Xm(2n) = 1} ODER {Xm(2n + 1) = 1} ODER {Xm(2n + 2) = 1} ODER {Xm(2n + 3) =1} ODER {Xm(2n + 4) = 1} ODER {Xm(2n + 5) = 1}, und andernfalls 0; für alle n in
    Figure 00180001
    wobei Xm(n) die Maske vor dem Umkehrungsschritt ist, Lm(n) und Hm(n) die Masken nachher sind für das Nieder- und Hochfrequenzunterband, und wobei n die Nummer eines Koeffizienten in einer Zeile ist, die aktualisiert wird.
  5. Verfahren gemäß einem der Ansprüche 1 – 4, wobei eine Anfrage für eine neue Maske empfangen wird, dadurch gekennzeichnet, dass eine neue Maske entsprechend eines neuen interessierenden Bereiches berechnet wird, und dass die entsprechenden Koeffizienten übermittelt werden.
  6. Eine Vorrichtung zum verlustlosen Übermitteln eines interessierenden Bereiches eines S+P transformationscodierten digitalisierten Bildes, gekennzeichnet durch – Mittel zum Berechnen einer Maske, die Koeffizienten des S+P transformierten Bildes anzeigen, die dem interessierenden Bereich entsprechen, und zum Übermitteln der Koeffizienten.
  7. Vorrichtung gemäß Anspruch 6, gekennzeichnet durch – Mittel zum Übermitteln der Koeffizienten des S+P transformierten Bildes, das dem interessierenden Bereich in den frühen Stufen der Übermittlung entspricht, um in einem Empfänger einen verlustlosen interessierenden Bereich und ein verlustbehaftetes verbleibendes Bild zu erhalten.
  8. Eine Vorrichtung gemäß einem der Ansprüche 6 – 7, gekennzeichnet durch – Mittel zum Erhalten der Maske durch Verfolgen eines Rückwärtsschrittes auf einer separaten Zeile, und dass dann die folgenden Schritte ausgeführt werden: – Einstellen von Hm(n) = 1 Wenn {Xm(2n) = 1} ODER {Xm(2n + 1) = 1}, und andernfalls 0 – Einstellen von Lm(n) = 1 Wenn {Xm(2n – 2) = 1} ODER {Xm(2n – 1) =1} ODER {Xm(2n) = 1} ODER {Xm(2n + 1) = 1} ODER {Xm(2n + 2) = 1} ODER {Xm(2n + 3) = 1}, und andernfalls 0 für alle n in
    Figure 00190001
    wobei Xm(n) die Maske vor dem Umkerungsschritt ist, Lm(n) und Hm(n) die Masken nachher sind für das Nieder- und Hochfrequenzunterband, und wobei n die Nummer eines Koeffizienten in einer Zeile ist, die aktualisiert ist.
  9. Vorrichtung gemäß einem der Ansprüche 6 – 7, gekennzeichnet durch – Mittel zum Erhalten der Maske durch Verfolgen eines Rückwärtsschrittes auf einer separaten Zeile, und dass die folgenden Schritte dann ausgeführt werden: – Einstellen von Hm(n) = 1 Wenn {Xm(2n) = 1} ODER {Xm(2n + 1) = 1}, und andernfalls 0 – Einstellen von Lm(n) = 1 Wenn {Xm(2n – 4) = 1} ODER {Xm(2n – 3) = 1} ODER {Xm(2n – 2) = 1} ODER {Xm(2n – 1) = 1} ODER {Xm(2n) = 1} ODER {Xm(2n + 1) = 1} ODER {Xm(2n + 2)= 1} ODER {Xm(2n + 3) = 1} ODER {Xm(2n + 4) = 1} ODER {Xm(2n + 5) = 1}, und andernfalls 0; für alle n in
    Figure 00200001
    wobei Xm(n) die Maske vor dem Umkehrungsschritt ist, Lm(n) und Hm(n) die Masken nachher sind für das Nieder- und Hochfrequenzunterband, und wobei n die Nummer eines Koeffizienten in einer Zeile ist, die aktualisiert ist.
  10. Vorrichtung gemäß einem der Ansprüche 6 – 9, gekennzeichnet durch – Mittel zum Berechnen einer neuen Maske, wenn eine Anfrage für einen neuen interessierenden Bereich empfangen wird.
DE69833004T 1997-10-10 1998-10-07 Verlustfreie kodierung eines interessierenden gebiets Expired - Lifetime DE69833004T2 (de)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
SE9703690A SE512840C2 (sv) 1997-10-10 1997-10-10 Förfarande och anordning för förlustfri kodning av ett intressant område vid överföring av en stillbild
SE9703690 1997-10-10
SE9800088 1998-01-16
SE9800088A SE9800088D0 (sv) 1997-10-10 1998-01-16 Long filter lossless region of interest coding
PCT/SE1998/001809 WO1999019839A1 (en) 1997-10-10 1998-10-07 Lossless region of interest coding

Publications (2)

Publication Number Publication Date
DE69833004D1 DE69833004D1 (de) 2006-02-02
DE69833004T2 true DE69833004T2 (de) 2006-07-06

Family

ID=26663099

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69833004T Expired - Lifetime DE69833004T2 (de) 1997-10-10 1998-10-07 Verlustfreie kodierung eines interessierenden gebiets

Country Status (11)

Country Link
US (3) US6775412B1 (de)
EP (2) EP1617674A3 (de)
JP (1) JP2001520466A (de)
CN (1) CN1132125C (de)
AU (1) AU750547B2 (de)
CA (1) CA2306372C (de)
DE (1) DE69833004T2 (de)
ES (1) ES2251101T3 (de)
HK (1) HK1031940A1 (de)
SE (1) SE9800088D0 (de)
WO (1) WO1999019839A1 (de)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4213836B2 (ja) * 2000-02-09 2009-01-21 株式会社マンダム 育毛剤組成物
JP4213837B2 (ja) * 2000-02-18 2009-01-21 株式会社マンダム 育毛剤組成物
FR2815748B1 (fr) * 2000-10-20 2003-01-24 Canon Kk Procede et dispositif de traitement et de decodage d'un signal numerique code
US7209777B2 (en) 2000-11-30 2007-04-24 General Electric Company Method and apparatus for automated tracking of non-linear vessel movement using MR imaging
WO2002073812A1 (fr) 2001-03-14 2002-09-19 Matsushita Electric Industrial Co., Ltd. Procede de codage de correction d'erreur, procede de decodage de correction d'erreur et appareils de codage et de decodage de correction d'erreur
US6882755B2 (en) * 2001-10-19 2005-04-19 Hewlett-Packard Development Company, L.P. Image transmission for low bandwidth with region of interest
GB2382940A (en) 2001-11-27 2003-06-11 Nokia Corp Encoding objects and background blocks
TW569159B (en) * 2001-11-30 2004-01-01 Inst Information Industry Video wavelet transform processing method
US20040022447A1 (en) * 2002-07-31 2004-02-05 General Electric Company Method and system for image compression and decompression using span of interest of an imaging sequence
US8204079B2 (en) * 2002-10-28 2012-06-19 Qualcomm Incorporated Joint transmission of multiple multimedia streams
US20040083495A1 (en) * 2002-10-29 2004-04-29 Lane Richard D. Mulitmedia transmission using variable gain amplification based on data importance
US7274823B2 (en) * 2002-11-12 2007-09-25 Qualcomm Incorporated System and method for processing symbols embedded in digital video
JP2005223852A (ja) * 2004-02-09 2005-08-18 Sanyo Electric Co Ltd 画像符号化装置および方法、ならびに画像復号装置および方法
US8977063B2 (en) * 2005-03-09 2015-03-10 Qualcomm Incorporated Region-of-interest extraction for video telephony
US8019175B2 (en) * 2005-03-09 2011-09-13 Qualcomm Incorporated Region-of-interest processing for video telephony
JP2006295299A (ja) * 2005-04-06 2006-10-26 Megachips Lsi Solutions Inc デジタル絞りシステム
US8224102B2 (en) 2005-04-08 2012-07-17 Agency For Science, Technology And Research Method for encoding a picture, computer program product and encoder
US20080219567A1 (en) * 2007-03-07 2008-09-11 General Electric Company Tomosynthesis imaging data compression system and method
US7970203B2 (en) * 2007-03-19 2011-06-28 General Electric Company Purpose-driven data representation and usage for medical images
US8121417B2 (en) * 2007-03-19 2012-02-21 General Electric Company Processing of content-based compressed images
US7929793B2 (en) * 2007-03-19 2011-04-19 General Electric Company Registration and compression of dynamic images
US8345991B2 (en) * 2007-03-19 2013-01-01 General Electric Company Content-based image compression
US8406546B2 (en) * 2009-06-09 2013-03-26 Sony Corporation Adaptive entropy coding for images and videos using set partitioning in generalized hierarchical trees
US8356114B2 (en) 2010-04-15 2013-01-15 Canon Kabushiki Kaisha Region of interest-based image transfer
US8755441B2 (en) 2010-05-10 2014-06-17 Canon Kabushiki Kaisha Region of interest-based video transfer
US8971641B2 (en) * 2010-12-16 2015-03-03 Microsoft Technology Licensing, Llc Spatial image index and associated updating functionality
JP6165491B2 (ja) 2013-04-12 2017-07-19 株式会社メガチップス 画像処理装置および画像処理方法
JP6345961B2 (ja) 2014-03-28 2018-06-20 株式会社メガチップス 画像復号化装置および画像復号化方法
CN105592285B (zh) 2014-10-21 2020-04-21 华为技术有限公司 Roi视频实现方法及装置
JP6471022B2 (ja) 2015-03-31 2019-02-13 株式会社メガチップス 画像処理システムおよび画像処理方法
JP6471023B2 (ja) 2015-03-31 2019-02-13 株式会社メガチップス 画像処理システムおよび画像処理方法
CN105049949A (zh) * 2015-06-19 2015-11-11 美国掌赢信息科技有限公司 一种即时视频的编码方法和电子设备
JP6577855B2 (ja) 2015-12-14 2019-09-18 株式会社メガチップス 画像処理システムおよび画像処理方法
CN106686387A (zh) * 2016-12-30 2017-05-17 杭州占峰科技有限公司 一种应用于字轮水表表面拍照的图片压缩方法
US10771163B2 (en) * 2017-10-24 2020-09-08 Mediatek Inc. Apparatus and method for decoding ROI regions in image
CN109982085A (zh) * 2017-12-28 2019-07-05 新岸线(北京)科技集团有限公司 一种高精度图像混合压缩的方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4698689A (en) 1986-03-28 1987-10-06 Gte Laboratories Incorporated Progressive image transmission
US4903317A (en) * 1986-06-24 1990-02-20 Kabushiki Kaisha Toshiba Image processing apparatus
FR2660139B1 (fr) 1990-03-23 1995-08-25 France Etat Procede de codage et de transmission a au moins deux niveaux de qualite d'images numeriques appartenant a une sequence d'images, et dispositifs correspondants.
US5001561A (en) 1990-05-02 1991-03-19 At&T Bell Laboratories Embedded coding system for video signals
US5333212A (en) 1991-03-04 1994-07-26 Storm Technology Image compression technique with regionally selective compression ratio
JP2802694B2 (ja) 1991-10-30 1998-09-24 富士写真フイルム株式会社 画像再生装置および方法
US5339108A (en) 1992-04-09 1994-08-16 Ampex Corporation Ordering and formatting coded image data and reconstructing partial images from the data
US5563960A (en) 1993-01-22 1996-10-08 David Sarnoff Research Center, Inc. Apparatus and method for emphasizing a selected region in the compressed representation of an image
JP3499254B2 (ja) * 1993-06-04 2004-02-23 富士写真フイルム株式会社 画像データ圧縮処理方法
JP3169783B2 (ja) * 1995-02-15 2001-05-28 日本電気株式会社 動画像の符号化・復号システム
KR0181032B1 (ko) * 1995-03-20 1999-05-01 배순훈 인터리빙을 이용한 물체 기반 부호화방법 및 장치
US5991816A (en) * 1996-12-13 1999-11-23 Wisconsin Alumni Research Foundation Image transfer protocol in progressively increasing resolution

Also Published As

Publication number Publication date
ES2251101T3 (es) 2006-04-16
CN1132125C (zh) 2003-12-24
US20050271290A1 (en) 2005-12-08
JP2001520466A (ja) 2001-10-30
EP1021796B1 (de) 2005-12-28
US20040264794A1 (en) 2004-12-30
HK1031940A1 (en) 2001-06-29
AU750547B2 (en) 2002-07-18
SE9800088D0 (sv) 1998-01-16
EP1617674A2 (de) 2006-01-18
CA2306372C (en) 2009-12-22
DE69833004D1 (de) 2006-02-02
EP1617674A3 (de) 2006-02-08
CA2306372A1 (en) 1999-04-22
US6775412B1 (en) 2004-08-10
WO1999019839A1 (en) 1999-04-22
AU9470298A (en) 1999-05-03
EP1021796A1 (de) 2000-07-26
CN1275226A (zh) 2000-11-29

Similar Documents

Publication Publication Date Title
DE69833004T2 (de) Verlustfreie kodierung eines interessierenden gebiets
DE69818850T2 (de) Videocodierungs- und -decodierungsvorrichtung
DE60129931T2 (de) Verfahren und vorrichtung zur komprimierung von transformationsdaten
DE69633129T2 (de) Waveletbaum-bildcoder mit überlappenden bildblöcken
DE19844752B4 (de) Ein verbessertes Kompressions- und Dekompressionssystem mit reversiblen Wavelets und verlustbehafteter Rokonstruktion
DE19503571B4 (de) Bildkompressionsverfahren und -vorrichtung unter Verwendung eines bedingten Viergruppenbaumunterteilungssystems
DE69434862T2 (de) Segmentierungs-basiertes entfernen von artefakten aus einem jpeg-bild
DE69434018T2 (de) Bildkodierungsverfahren und -vorrichtung
DE69535007T2 (de) Verfahren und Vorrichtung zur objektbasierten prädiktiven Kodierung und Übertragung von digitalen Bildern und Dekodierungsvorrichtung
DE19638632B4 (de) Verfahren und Vorrichtung zur Bewegtbildkodierung
DE69732761T2 (de) Verfahren und Vorrichtung zur kalkulierbaren Audiocodierung bzw.-decodie- rung
DE60222728T2 (de) Verfahren und System mit verbesserter Kodierungseffektivität eines Bildkodierer-Dekodierers
DE69728757T2 (de) Verfahren und Vorrichtung zum Kodieren eines Objektes unter Verwendung einer Konturbewegungsschätztechnik
DE10043188A1 (de) Fehlerkorrekturverfahren für Videokompressionskodierung unter Verwendung von mehreren Referenzpuffern und einem Nachrichtenkanal
DE69630297T2 (de) Weiterentwickeltes fernsehsystem
EP0773690A2 (de) Verfahren zur Codierung eines Videodatenstroms
EP1472888B1 (de) Kontextsensitive kodierung und dekodierung eines videodatenstroms
DE60107149T2 (de) Digitales Bildausgabegerät
DE19903605B4 (de) Verfahren zum Neuanordnen von Signalverlaufspacket-Koeffizienten
EP1164549A2 (de) Verfahren und Anordnung zur Kodierung von Livebildern in der Mikroskopie
DE69826878T2 (de) Wiederkodierung von dekodierten signalen
DE69636273T2 (de) Bewegtbildcodiervorrichtung, Bewegtbilddecodiervorrichtung und Bewegtbildcodier-/-Decodiervorrichtung
DE3917362C2 (de) Verfahren zum Vermindern visueller Artefakte aufgrund von Kompression über eine Transformierte in medizinischen Bildern
EP1279291B1 (de) Verfahren und vorrichtung zum speichern und bearbeiten von bildinformation zeitlich aufeinanderfolgender bilder
EP0336510B1 (de) Prädiktiver Standbildcodierer

Legal Events

Date Code Title Description
8364 No opposition during term of opposition