DE69725765T2 - Bilddekoder und Verfahren zur Bilddekodierung - Google Patents

Bilddekoder und Verfahren zur Bilddekodierung Download PDF

Info

Publication number
DE69725765T2
DE69725765T2 DE69725765T DE69725765T DE69725765T2 DE 69725765 T2 DE69725765 T2 DE 69725765T2 DE 69725765 T DE69725765 T DE 69725765T DE 69725765 T DE69725765 T DE 69725765T DE 69725765 T2 DE69725765 T2 DE 69725765T2
Authority
DE
Germany
Prior art keywords
image
block
value
pixel
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69725765T
Other languages
English (en)
Other versions
DE69725765D1 (de
Inventor
Koichi Sakai-shi Hata
Minoru Etoh
Takeshi Ankei
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Application granted granted Critical
Publication of DE69725765D1 publication Critical patent/DE69725765D1/de
Publication of DE69725765T2 publication Critical patent/DE69725765T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/413Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information
    • H04N1/417Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information using predictive or differential encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/413Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information
    • H04N1/415Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information in which the picture-elements are subdivided or grouped into fixed one-dimensional or two-dimensional blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

  • Die vorliegende Erfindung bezieht sich auf eine Bild-Decodiervorrichtung und auf ein Bild-Decodierverfahren.
  • Wenn Bilder zusammengestellt werden, sind Fälle vorhanden, bei denen Informationen, bezeichnet als ein Alpha-Wert, der den Überlegungsbereich und den Grad einer Transparenz eines Objekts anzeigt, zusätzlich zu der Luminanz des Objekts angehängt werden. Der Alpha-Wert wird für jedes Pixel bestimmt, wobei ein Alpha-Wert von 1 eine vollständige Opazität oder eine Okklusion und ein Alpha-Wert von 0 eine vollständige Transparenz oder Nicht-Okklusion anzeigt. Alpha-Werte werden notwendig, wenn sich ein Bild eines Objekts auf einem Hintergrundbild überlegt. Nachfolgend wird ein Bild, das nur durch solche Alpha-Werte dargestellt ist, als Alpha-Ebene bezeichnet.
  • In dem Fall einer Wolke, einer gefrorenen Scheibe, usw., kann ein Alpha-Wert zwischen [0, 1] verwendet werden, um das Bild darzustellen, allerdings sind dabei Fälle vorhanden, bei denen zwei Werte {0, 1} ausreichend sind.
  • Für die Codierung einer herkömmlichen, binären Alpha-Ebene können Binär-Bild-Codier-Techniken, wie beispielsweise MR und MMR, definiert in den International Standards der CCITT, traditionell verwendet für Facsimile-Systeme, usw., oder Codier-Techniken, standardisiert durch JBIG, verwendet werden. Diese Codier-Schemata werden in generischer Weise als binäre Standbild-Codierung bezeichnet. Bei einer binären Standbild-Codierung kann ein effizientes Codieren durch Vorhersage eines Pixels niedriger Ordnung von einem Pixel hoher Ordnung in der Abtastrichtung und durch eine Entropie-Codierung der Differenz dazwischen erreicht werden.
  • In einem binären Bewegungsbild, wie beispielsweise zwei aufeinanderfolgende Alpha-Ebenen eines Bewegungsbilds, kann eine Korrelation zwischen zwei aufeinanderfolgenden Einzelbildern verwendet werden. Das bedeutet, dass eine effiziente Codierung durch Vorhersagen eines Pixels, das codiert werden soll, aus einem zuvor codierten Bild, das eine hohe Korrelation besitzt, und durch Codieren der Differenz dazwischen, im Gegensatz zu einem Vorhersagen eines Pixels niedriger Ordnung von einem Pixel hoher Ordnung in der Abtastrichtung, und Codieren der Differenz dazwischen, erreicht werden kann.
  • Allerdings hat eine Binär-Standbild-Codierung im Stand der Technik nur die Korrelation zwischen den Pixeln hoher Ordnung und niedriger Ordnung in der Abtastrichtung ausgewertet, gerade dann, wenn ein binäres Bild, das eine hohe Korrelation zu dem Bild, das codiert oder decodiert werden soll, besitzt, an dem Codierer oder Decodieren erhalten wird, und demzufolge hatte der Stand der Technik das Problem gehabt, dass eine größere Anzahl von Code-Bits erforderlich ist.
  • Für das Codieren einer herkömmlichen Alpha-Ebene wird ein Wellenform-Codieren verwendet, wie es in dem JPEG Codier-Schema vorgenommen wird.
  • Allerdings besitzen viele Alpha-Ebenen die Eigenschaft, dass die meisten Bereiche gleichförmig sind und Zwischenwerte entlang der Grenze bzw. des Rands verteilt sind.
  • Da solche Alpha-Ebenen Hochfrequenzkomponenten entlang der Grenze enthalten, hatte das Wellenform-Codieren, wie es im Stand der Technik eingesetzt ist, das Problem, dass eine effiziente Codierung schwierig zu erreichen ist.
  • Ramaswamy et al beschreiben in „Multiprocessor DSP Architectures That Implement The FCT Based JPEG Still Picture Image Compression Algorithm With Arithmetic Coding" in IEEE Transactions On Consumer Electronics, vol. 39, No. 1, 1. Februar 1993, parallel im Pipeline-Verfahren betriebene DSP-Architekturen. Die DSP-Architekturen führen den JPEG-Standbild-Kompressions-Algorithmus aus. Während einer Bildkompression wird ein Grauskalierungsbild zuerst in Pixel-Blöcke gruppiert. Diese Blöcke werden durch eine zweidimensionale DCT verarbeitet. Die erhaltenen DCT-Koeffizienten werden quantisiert und mit Entropie codiert. Während des Decodiervorgangs wird das komprimierte Bild zuerst einer arithmetischen Decodierung unterworfen und die erhaltenen DCT-Koeffizienten werden dequantisiert. Jeder Pixel-Block wird durch Anwenden einer inversen DCT zurückgewonnen.
  • Eine andere Bilddecodiervorrichtung nach dem Stand der Technik zum Komprimieren von Bilddaten ist aus der EP-A-0 597 733 bekannt. In der Codiervorrichtung werden binäre Daten eines Objekt-Pixels, das codiert werden soll, zu einem Exklusiv-Oder-Gatter zugeführt. Weiterhin werden binäre Daten einer Vielzahl von Referenz-Pixeln in der Nähe des Objekt-Pixels zu einem Speicher für einen prädikativen Zustand zugeführt. Der Speicher für den prädikativen Zustand führt prädikative Pixel-Daten zu dem Exklusiv-Oder- Gatter entsprechend dem Zustand der Referenz-Pixel-Daten zu. Das Exklusiv-Oder-Gatter prüft, ob die binären Daten mit den prädikativen Pixel-Daten von dem Speicher für den prädikativen Zustand übereinstimmen und führt das Ergebnis zu einem arithmetischen Codierer zu.
  • Die US-A-5 486 863 beschreibt ein Verfahren zum Auswählen eines geeigneten Kompressions-Mode während einer Video-Kompression. Das beschriebene Verfahren bestimmt, ob ein Video-Block (Intra-Codierung) zu codieren ist, oder ob eine Differenz zwischen dem Video-Block und einem vorher gespeicherten Video-Block zu codieren ist (Nicht-Intra-Codierung). Dies wird durch Unterteilen eines Video-Blocks, der codiert werden soll, in einem bestimmten Satz von Unterblöcken vorgenommen. Für jeden der Unterblöcke wird ein durchschnittlicher Pixelwert berechnet und verwendet – zusammen mit dem tatsächlichen Pixel-Wert – , um eine Unterblock-Abweichung zu bestimmen. Basierend auf der Unterblock-Abweichung wird eine Block-Abweichung des momentanen Video-Blocks berechnet. Weiterhin wird eine Fehlerabweichung für jeden der Blöcke durch Vergleichen der Pixel des momentanen Video-Blocks mit den Pixeln eines am besten passenden Video-Blocks berechnet. Basierend auf dem Ergebnis eines Vergleichs zwischen der Fehlerabweichung und der Abweichung des momentanen Blocks wird eine Entscheidung vorgenommen, um den momentanen Video-Block intra oder nicht-intra zu codieren.
  • Im Hinblick auf den Stand der Technik ist es die Aufgabe der vorliegenden Erfindung, eine Bild-Decodiervorrichtung und ein Bild-Decodierverfahren zu schaffen, die eine erhöhte Effektivität haben.
  • Dies wird durch die Merkmale von Anspruch 1 für eine Bild-Decodiervorrichtung und durch die Merkmale von Anspruch 6 für ein Bild-Decodierverfahren erreicht.
  • Gemäß einem ersten Aspekt der vorliegenden Erfindung weist eine Bild-Decodiervorrichtung zum Decodieren decodierter Daten, die durch Codieren eines binären Bilds auf einem Block erhalten sind, um den Ziel-Block des binären Bilds zurückzugewinnen, eine bewegungs-kompensierte Blockbildungseinrichtung, eine ein statistisches Modell auswählende Einrichtung und eine arithmetische Decodiereinrichtung auf. Die bewegungskompensierte Blockbildungseinrichtung erhält einen Referenz-Block von einem binären Referenzbild durch Anwenden einer Bewegungskompensation unter Verwendung von Bewegungsinformationen. Die Statistik-Modell-Auswahleinrichtung wählt ein statistisches Modell aus einer Mehrzahl von statistischen Modellen basierend auf den Zuständen von Pixeln, die ein Referenz-Pixel in dem Referenz-Block umgeben, aus. Das Referenz-Pixel entspricht einem Ziel-Pixel in dem Ziel-Block. Die arithmetische Decodiereinrichtung gewinnt den Ziel-Block durch Decodieren der codierten Daten unter Verwendung des ausgewählten statistischen Modells zurück.
  • Gemäß einem weiteren Aspekt der vorliegenden Erfindung wird ein Bild-Decodierverfahren zum Decodieren codierter Daten geschaffen, die durch Codieren jedes Blocks eines binären Bilds erhalten wurden, um einen Ziel-Block des binären Bilds zu gewinnen. Erstens weist das Bild-Decodierverfahren den Schritt eines Erhaltens eines Referenz-Blocks von einem binären Referenz-Bild durch Anwenden einer Bewegungskompensation unter Verwendung von Bewegungsinformationen auf. Basierend auf den Zuständen von Pixeln, die ein Referenz-Pixel in dem Referenz-Block umgeben, wobei das Referenz-Pixel einem Ziel-Pixel in dem Ziel-Block entspricht, wird ein statistisches Modell aus einer Mehrzahl statistischer Modelle ausgewählt. Um den Ziel-Block zurückzugewinnen, werden die codierten Daten arithmetisch unter Verwendung des ausgewählten statistischen Modells decodiert.
  • 1 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer A1. Ausführungsform der vorliegenden Erfindung.
  • 2 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer A2. Ausführungsform der vorliegenden Erfindung.
  • 3 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer A3. Ausführungsform der vorliegenden Erfindung.
  • 4 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer A4. Ausführungsform der vorliegenden Erfindung.
  • 5 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer A5. Ausführungsform der vorliegenden Erfindung.
  • 6 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer A6. Ausführungsform der vorliegenden Erfindung.
  • 7 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer A7. Ausführungsform der vorliegenden Erfindung.
  • 8 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer A8. Ausführungsform der vorliegenden Erfindung.
  • 9 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer A9. Ausführungsform der vorliegenden Erfindung.
  • 10 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer A10. Ausführungsform der vorliegenden Erfindung.
  • 11 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer A11. Ausführungsform der vorliegenden Erfindung.
  • 12 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer A12. Ausführungsform, einer Ausführungsform der vorliegenden Erfindung.
  • 13 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer A13. Ausführungsform der vorliegenden Erfindung.
  • 14 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer A14. Ausführungsform der vorliegenden Erfindung.
  • 15 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer A15. Ausführungsform der vorliegenden Erfindung.
  • 16 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer A16. Ausführungsform der vorliegenden Erfindung.
  • 17 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer A17. Ausführungsform der vorliegenden Erfindung.
  • 18 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer A18. Ausführungsform der vorliegenden Erfindung.
  • 19 zeigt ein Diagramm, das ein Referenz-Bild und ein Sollbild in einem Masken-Bewegungs-Bild darstellt.
  • 20 zeigt ein Diagramm zum Erläutern, wie ein Exklusiv-ODER-Block konstruiert ist.
  • 21 zeigt ein Diagramm zum Erläutern des Prinzips eines arithmetischen Codierens.
  • 22 zeigt ein Blockdiagramm für ein arithmetisches Codieren.
  • 23 zeigt ein Diagramm, das einen Bereich einer Statistik-Modell-Tabelle darstellt.
  • 24 zeigt ein Diagramm, das einen Bereich der Statistik-Modell-Tabelle darstellt.
  • 25 zeigt ein Diagramm, das einen Bereich der Statistik-Modell-Tabelle darstellt.
  • 26 zeigt ein Diagramm, das einen Bereich der Statistik-Modell-Tabelle darstellt.
  • 27 zeigt ein Diagramm zum Erläutern von extra polierten Referenz-Blöcken. 28 zeigt ein Diagramm zum Erläutern von Indizes in der Statistik-Modell-Tabelle.
  • 29 zeigt ein Diagramm zum Erläutern einer Frequenz-zu-Erzeugungswahrscheinlichkeit Konversationsgrafik.
  • 30 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer anderen Ausführungsform.
  • 31 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung.
  • 32 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer noch anderen Ausführungsform.
  • 33 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß derselben Ausführungsform.
  • 34 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer noch anderen Ausführungsform.
  • 35 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß derselben Ausführungsform.
  • 36 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer B1. Ausführungsform.
  • 37 zeigt ein Diagramm, das ein Mehr-Wert-Bild, verwendet in derselben Ausführungsform, darstellt.
  • 38 zeigt ein Verteilungsdiagramm von Pixel-Werten entlang einer Linie A-B in 37.
  • 39 zeigt ein Blockdiagramm einer Glättungs-Funktion-Abschätzeinrichtung gemäß der B1. Ausführungsform.
  • 40 zeigt ein Diagramm zum Erläutern einer Nicht-Maximum-Wert-Unterdrückung, verwendet in der Ausführungsform.
  • 41 zeigt ein Diagramm, das die Korrespondenz zwischen einem normierten Durchschnitt-Gradienten und einem Glättungsfilter gemäß der B1. Ausführungsform darstellt.
  • 42 zeigt ein Diagramm zum Erläutern des Glättungsfilters gemäß der B1. Ausführungsform.
  • 43 zeigt ein Diagramm zum Erläutern von Glättungsfilter-Stufen-Ansprechverhalten gemäß der B1. Ausführungsform.
  • 44 zeigt ein Diagramm zum Erläutern einer Schwellwertbildung, verwendet in der Ausführungsform.
  • 45 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer B2. Ausführungsform.
  • 46 zeigt ein Diagramm zum Erläutern einer Pixel-Wert-Konversion, verwendet in der Ausführungsform.
  • 47 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer B3. Ausführungsform.
  • 48 zeigt ein Blockdiagramm einer Glättungs-Funktion-Abschätzeinrichtung gemäß der B3. Ausführungsform.
  • 49 zeigt ein Diagramm, das die Korrespondenz zwischen einem normierten Durchschnitt-Gradienten und einem Glättungsfilter gemäß der B3. Ausführungsform darstellt.
  • 50 zeigt ein Diagramm zum Erläutern des Glättungsfilters gemäß der B3. Ausführungsform.
  • 51 zeigt ein Diagramm zum Erläutern von Glättungsfilter-Stufen-Ansprechverhalten gemäß der B3. Ausführungsform.
  • 52 zeigt ein Diagramm zum Erläutern eines morphologischen Filters in der Ausführungsform.
  • 53 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer B4. Ausführungsform.
  • 54 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer B5. Ausführungsform.
  • 55 zeigt ein Blockdiagramm einer Glättungs-Funktion-Abschätzeinrichtung gemäß der B5. Ausführungsform.
  • 56 zeigt ein Diagramm zum Erläutern eines Glättungsfilters gemäß der B5.
  • Ausführungsform.
  • 57 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer B6.
  • Ausführungsform.
  • 58 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer B7.
  • Ausführungsform.
  • 59 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer B8.
  • Ausführungsform.
  • 60 zeigt ein Diagramm zum Erläutern eines Glättungs-Musters in der B7., B8., B9. und B10. Ausführungsform.
  • 61 zeigt ein Diagramm zum Erläutern einer Mehrstufen-Glättung in der B7., B8., B9. und B10. Ausführungsform.
  • 62 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß der B9.
  • Ausführungsform.
  • 63 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß der B10.
  • Ausführungsform.
  • 64 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer B11.
  • Ausführungsform.
  • 65 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung in einem modifizierten Beispiel der B1. Ausführungsform.
  • 66 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung gemäß einer anderen Ausführungsform.
  • 67 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung in einem modifizierten Beispiel der Ausführungsform, dargestellt in 66.
  • 68 zeigt ein Blockdiagramm einer Bild-Codiervorrichtung in einem modifizierten Beispiel der B11. Ausführungsform.
  • 69 zeigt ein Blockdiagramm einer Bild-Decodiervorrichtung gemäß einer anderen Ausführungsform.
  • 101
    BLOCKBILDUNGSEINRICHTUNG 1
    102
    BLOCKBILDUNGSEINRICHTUNG 2
    103
    EXKLUSIV-ODER-BLOCK-KONSTRUIEREINRICHTUNG
    104
    EXKLUSIV-ODER-CODIEREINRICHTUN
    201
    EXKLUSIV-ODER-DECODIEREINRICHTUNG
    202
    BLOCKBILDUNGSEINRICHTUNG 2
    203
    SOLLBLOCK-KONSTRUIEREINRICHTUNG
    301
    BLOCKBILDUNGSEINRICHTUNG 1
    302
    BEWEGUNGSKOMPENSIERTE BLOCKBILDUNGSEINRICHTUNG 2
    303
    EXKLUSIV-ODER-BLOCK-KONSTRUIEREINRICHTUNG
    304
    EXKLUSIV-ODER-CODIEREINRICHTUNG
    305
    BEWEGUNGSABSCHÄTZEINRICHTUNG
    401
    EXKLUSIV-ODER-DECODIEREINRICHTUNG
    402
    BEWEGUNGSKOMPENSIERTE BLOCKBILDUNGSEINRICHTUNG 2
    403
    SOLL-BLOCK-KONSTRUIEREINRICHTUNG
    501
    BLOCKBILDUNGSEINRICHTUNG 1
    502
    BLOCKBILDUNGSEINRICHTUNG 2
    503
    EXKLUSIV-ODER-BLOCK-KONSTRUIEREINRICHTUNG
    504
    EXKLUSIV-ODER-CODIEREINRICHTUNG
    505
    REFERENZBLOCK-ADOPTION-BESTIMMUNGSEINRICHTUNG
    506
    SOLL-PIXEL-CODIEREINRICHTUNG
    601
    EXKLUSIV-ODER-DECODIEREINRICHTUNG
    602
    BLOCKBILDUNGSEINRICHTUNG 2
    603
    SOLL-BLOCK-KONSTRUIEREINRICHTUNG
    604
    REFERENZBLOCK-ADOPTION-STEUEREINRICHTUNG
    605
    SOLL-PIXEL-DECODIEREINRICHTUNG
    701
    BLOCKBILDUNGSEINRICHTUNG 1
    702
    BLOCKBILDUNGSEINRICHTUNG 2
    703
    ABSCHÄTZEINRICHTUNG FÜR EIN STATISTISCHES MODELL
    704
    STATISTISCHES MODELL
    705
    ENTROPIE-CODIEREINRICHTUNG
    801
    ENTROPIE-DECODIEREINRICHTUNG
    802
    BLOCKBILDUNGSEINRICHTUNG 2
    803
    ABSCHÄTZEINRICHTUNG FÜR DAS STATISTISCHE MODELL
    804
    STATISTISCHES MODELL
    901
    BLOCKBILDUNGSEINRICHTUNG 1
    902
    BEWEGUNGSKOMPENSIERTE BLOCKBILDUNGSEINRICHTUNG
    903
    ABSCHÄTZEINRICHTUNG FÜR EIN STATISTISCHES MODELL
    904
    STATISTISCHES MODELL
    905
    ENTROPIE-CODIEREINRICHTUNG
    906
    BEWEGUNGSABSCHÄTZEINRICHTUNG
    1001
    ENTROPIE-DECODIEREINRICHTUNG
    1002
    BEWEGUNGSKOMPENSIERTE BLOCKBILDUNGSEINRICHTUNG
    1003
    STATISTIK-MODELL-AUSWAHLEINRICHTUNG
    1004
    STATISTIK-MODELL-TABELLE
    1101
    BLOCKBILDUNGSEINRICHTUNG 1
    1102
    BLOCKBILDUNGSEINRICHTUNG 2
    1103
    STATISTIK-MODELL-AUSWAHLEINRICHTUNG
    1104
    STATISTIK-MODELL-TABELLE
    1105
    ENTROPIE-CODIEREINRICHTUNG
    1106
    REFERENZBLOCK-ADOPTION-BESTIMMUNGSEINRICHTUNG
    1107
    SOLL-PIXEL-CODIEREINRICHTUNG
    1201
    ENTROPIE-DECODIEREINRICHTUNG
    1202
    BLOCKBILDUNGSEINRICHTUNG 2
    1203
    STATISTIK-MODELL-AUSWAHLEINRICHTUNG
    1204
    STATISTIK-MODELL-TABELLE
    1205
    REFERENZBLOCK-ADOPTION-STEUEREINRICHTUNG
    1206
    SOLL-PIXEL-DECODIEREINRICHTUNG
    1301
    BLOCKBILDUNGSEINRICHTUNG 1
    1302
    BLOCKBILDUNGSEINRICHTUNG 2
    1303
    STATISTIK-MODELL-ABSCHÄTZEINRICHTUNG
    1304
    STATISTIK-MODELL
    1305
    ENTROPIE-CODIEREINRICHTUNG
    1401
    ENTROPIE-DECODIEREINRICHTUNG
    1402
    BLOCKBILDUNGSEINRICHTUNG 2
    1403
    STATISTIK-MODELL-ABSCHÄTZEINRICHTUNG
    1404
    STATISTIK-MODELL
    1501
    BLOCKBILDUNGSEINRICHTUNG 1
    1502
    BEWEGUNGSKOMPENSIERTE BLOCKBILDUNGSEINRICHTUNG 2
    1503
    ENTROPIE-CODIEREINRICHTUNG
    1504
    STATISTIK-MODELL-ABSCHÄTZEINRICHTUNG
    1505
    STATISTIK-MODELL
    1506
    BEWEGUNGSABSCHÄTZEINRICHTUNG
    1601
    ENTROPIE-DECODIEREINRICHTUNG
    1602
    BEWEGUNGKOMPENSIERTE BLOCKBILDUNGSEINRICHTUNG 2
    1603
    STATISTIK-MODELL-ABSCHÄTZEINRICHTUNG
    1604
    STATISTIK-MODELL
    1701
    BLOCKBILDUNGSEINRICHTUNG 1
    1702
    BLOCKBILDUNGSEINRICHTUNG 2
    1703
    STATISTIK-MODELL-ABSCHÄTZEINRICHTUNG
    1704
    STATISTIK-MODELL
    1705
    ENTROPIE-CODIEREINRICHTUNG
    1706
    REFERENZBLOCK-ADOPTION-BESTIMMUNGSEINRICHTUNG
    1707
    SOLL-PIXEL-CODIEREINRICHTUNG
    1801
    ENTROPIE-DECODIEREINRICHTUNG
    1802
    BLOCKBILDUNGSEINRICHTUNG 2
    1803
    STATISTIK-MODELL-ABSCHÄTZEINRICHTUNG
    1804
    STATISTISCHES MODELL
    1805
    REFERENZ-BLOCK-ADOPTION-STEUEREINRICHTUNG
    1806
    SOLL-PIXEL-DECODIEREINRICHTUNG
    1901
    MASKEN-BEWEGUNGS-BILD
    1902
    REFERENZ-BILD
    1903
    SOLL-BILD
    1904
    REFERENZBLOCK-BILD
    1905
    SOLL-BLOCK-BILD
    2001
    REFERENZBLOCK
    2002
    SOLL-BLOCK
    2003
    EXKLUSIV-ODER-BLOCK
    2101
    ZAHLENLINIE
    2102
    BEREICH
    2103
    BINÄRER PUNKT
    2104
    ERZEUGUNGS-WAHRSCHEINLICHKEITS-MODELL
    2105
    SYMBOL-FOLGE
    2201
    START
    2202
    INITIALISIERUNGSBEREICH
    2203
    EINGABESYMBOL
    2204
    GRENZBEREICH
    2205
    END-SYMBOL?
    2206
    AUSGABE-BINÄR-PUNKT
    2207
    ENDE
    2301
    STATISTIK-MODELL-TABELLE
    2401
    REFERENZBLOCK
    2402
    EXTRAPOLIERTER REFERENZBLOCK
    2403
    EXTRAPOLIERTER REFERENZBLOCK
    2501
    REFERENZBLOCK
    2502
    SOLL-BLOCK
    2503
    REFERENZ-MASKE
    2504
    SOLL-MASKE
    2601
    KONVERSIONS-GRAFIK
    10101
    DYNAMIKBEREICH-ABSCHÄTZEINRICHTUNG
    10102
    GLÄTTUNGSFUNKTION-ABSCHÄTZEINRICHTUNG
    10103
    MEHRFACH-WERT-ZU-BINÄR-KONVERTIEREINRICHTUNG
    10104
    BINÄR-BILD-CODIEREINRICHTUNG
    10105
    DYNAMIK-BEREICH-CODIEREINRICHTUNG
    10106
    GLÄTTUNGSFUNKTION-CODIEREINRICHTUNG
    10201
    MEHRFACH-WERT-BILD
    10301
    X-RICHTUNG-FILTERUNG
    10302
    Y-RICHTUNG-FILTERUNG
    10303
    GRADIENTEN-ERFASSUNG
    10304
    GRADIENTEN-RICHTUNGS-ERFASSUNG
    10305
    NICHT-MAXIMUM-WERT-UNTERDRÜCKUNG
    10306
    DURCHSCHNITT-GRADIENTEN-ERFASSUNG
    10307
    GLÄTTUNGSFUNKTION-AUSWAHL
    10601
    FILTER 1
    10602
    FILTER 2
    10603
    FILTER 3
    10604
    FILTER 4
    10901
    BINÄR-BILD-DECODIEREINRICHTUNG
    10902
    GLÄTTUNGSFUNKTION-DECODIEREINRICHTUNG
    10903
    DYNAMIKBEREICH-DECODIEREINRICHTUNG
    10904
    BINÄR-ZU-MEHRFACH-WERT-KONVERTIEREINRICHTUNG
    10905
    BINÄR-MASKE-ANWENDUNGSEINRICHTUNG
    11101
    DYNAMIK-BEREICH-ABSCHÄTZEINRICHTUNG
    11102
    GLÄTTUNGSFUNKTION-ABSCHÄTZEINRICHTUNG
    11103
    MEHRFACH-WERT-ZU-BINÄR-KONVERTIEREINRICHTUNG
    11104
    BINÄR-BILD-CODIEREINRICHTUNG
    11105
    DYNAMIK-BEREICH-CODIEREINRICHTUNG
    11106
    GLÄTTUNGSFUNKTION-CODIEREINRICHTUNG
    11201
    X-RICHTUNG-FILTERUNG
    11202
    Y-RICHTUNG-FILTERUNG
    11203
    GRADIENTEN-ERFASSUNG
    11204
    GRADIENTEN-RICHTUNG-ERFASSUNG
    11205
    NICHT-MAXIMUM-WERT-UNTERDRÜCKUNG
    11206
    DURCHSCHNITT-GRADIENTEN-ERFASSUNG
    11207
    GLÄTTUNGSFUNKTION-KONSTRUKTION
    11401
    GLÄTTUNGS-FILTER-STUFE 2
    11402
    GLÄTTUNGS-FILTER-STUFE 3
    11403
    GLÄTTUNGS-FILTER-STUFE 4
    11404
    GLÄTTUNGS-FILTER-KOEFFIZIENTEN-TABELLE
    11601
    MORPHOLOGISCHER FILTER 1
    11602
    MORPHOLOGISCHER FILTER 2
    11603
    MORPHOLOGISCHER FILTER 3
    11701
    BINÄR-BILD-DECODIEREINRICHTUNG
    11702
    GLÄTTUNGSFUNKTION-DECODIEREINRICHTUNG
    11703
    DYNAMIK-BEREICH-DECODIEREINRICHTUNG
    11704
    BINÄR-ZU-MEHRFACH-WERT-KONVERTIEREINRICHTUNG
    11801
    DYNAMIK-BEREICH-ABSCHÄTZEINRICHTUNG
    11802
    GLÄTTUNGSFUNKTION-ABSCHÄTZEINRICHTUNG
    11803
    MEHRFACH-WERT-ZU-BINÄR-KONVERTIEREINRICHTUNG
    11804
    BINÄR-BILD-CODIEREINRICHTUNG
    11805
    DYNAMIK-BEREICH-CODIEREINRICHTUNG
    11806
    GLÄTTUNGSFUNKTION-KOEFFIZIENTEN-CODIEREINRICHTUNG
    11901
    X-RICHTUNG-FILTERUNG
    11902
    Y-RICHTUNG-FILTERUNG
    11903
    GRADIENTEN-ERFASSUNG
    11904
    GRADIENTEN-RICHTUNG-ERFASSUNG
    11905
    NICHT-MAXIMUM-WERT-UNTERDRÜCKUNG
    11906
    DURCHSCHNITT-GRADIENTEN-ERFASSUNG
    11907
    GLÄTTUNGSFUNKTION-ERZEUGUNG
    12101
    BINÄR-BILD-DECODIEREINRICHTUNG
    12102
    GLÄTTUNGSFUNKTION-KOEFFIZIENTEN-DECODIEREINRICHTUNG
    12103
    DYNAMIK-BEREICH-DECODIEREINRICHTUNG
    12104
    BINÄR-ZU-MEHRFACH-WERT-KONVERTIEREINRICHTUNG
    12201
    MEHRFACH-WERT-ZU-BINÄR-KONVERTIEREINRICHTUNG
    12202
    BINÄR-BILD-CODIEREINRICHTUNG
    12203
    GLÄTTUNGSFUNKTION-ABSCHÄTZEINRICHTUNG
    12204
    GLÄTTUNGSFUNKTION-CODIEREINRICHTUNG
    12301
    BINÄR-BILD-DECODIEREINRICHTUNG
    12302
    GLÄTTUNGSFUNKTION-DECODIEREINRICHTUNG
    12303
    BINÄR-ZU-MEHRFACH-WERT-KONVERTIEREINRICHTUNG
    12601
    MEHRFACH-WERT-ZU-BINÄR-KONVERTIEREINRICHTUNG
    12602
    BINÄR-BILD-CODIEREINRICHTUNG
    12603
    GLÄTTUNGSFUNKTION-ABSCHÄTZEINRICHTUNG
    12604
    GLÄTTUNGSFUNKTION-CODIEREINRICHTUNG
    12605
    BINÄR-ZU-MEHRFACH-WERT-KONVERTIEREINRICHTUNG
    12606
    DIFFERENZ-KALKULATOR
    12607
    REST-CODIEREINRICHTUNG
    12701
    BINÄR-BILD-DECODIERENRICHTUNG
    12702
    GLÄTTUNGSFUNKTION-DECODIEREINRICHTUNG
    12703
    BINÄR-ZU-MEHRFACH-WERT-KONVERTIEREINRICHTUNG
    12704
    REST-DECODIEREINRICHTUNG
    12705
    ADDIERER
  • Ausführungsformen gemäß der vorliegenden Erfindung werden nachfolgend unter Bezugnahme auf die beigefügten Zeichnungen beschrieben.
  • (Ausführungsform A1)
  • 1 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer Ausführungsform, die zum Verständnis hilfreich ist, der vorliegenden Erfindung darstellt.
  • In 1 ist eine Blockbildungseinrichtung 1 (101) eine Einrichtung, die als ein Eingang ein Ziel-Bild, das codiert werden soll, aufnimmt, und die das Eingabebild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine Blockbildungseinrichtung 2 (102) ist eine Einrichtung, die ein zuvor erhaltenes Referenz-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine Exklusiv-ODER-Block-Konstruiereinrichtung (103) ist eine Einrichtung, die einen Exklusiv-ODER-Block durch Abtasten eines Ziel-Blocks, genommen von dem Bild, unterteilt durch die Blockbildungseinrichtung 1 (101), und einem Referenz-Block, genommen von dem Bild, unterteilt durch die Blockbildungseinrichtung 2 (102), und durch Exklusiv-ODER-Bildung von Pixel-Werten dazwischen konstruiert. Die Exklusiv-ODER-Codiereinrichtung (104) ist eine Einrichtung, die den Exklusiv-ODER-Block codiert und die codierten Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Erfindung wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Codiervertahrens, beschrieben werden.
  • Hierbei wird das (t + 1)-te Einzelbild (1903) eines sich bewegenden Masken-Bilds (1901) einer Person, dargestellt in 19, als ein Ziel-Binär-Bild und das t-te Einzelbild (1902) als ein Referenz-Binär-Bild genommen. In den Diagrammen, die nachfolgend beschrieben sind, wird der Wert 1 durch schwarz dargestellt und ein Wert 0 wird durch weiß dargestellt. Das Ziel-Binär-Bild (1903) wird durch die Blockbildungseinrichtung 1 (101) in Ziel-Blöcke aus 8 × 8 Pixeln unterteilt, wie in einem Ziel-Block-Bild (1905) dargestellt ist. Eine Bild-Block-Bildung in der Blockbildungseinrichtung 1 (101) ist allerdings nicht auf Blöcke von 8 × 8 Pixeln oder 16 × 16 Pixeln beschränkt. Das Referenz-Binär-Bild (1902) wird in ähnlicher Weise in Referenz-Blöcke unterteilt, wie in einem Referenz-Block-Bild (1904) dargestellt ist.
  • Das Referenz-Binär-Bild (1902) wird durch die Blockbildungseinrichtung 2 (102) in Referenz-Blöcke von 8 × 8 Pixeln unterteilt, wie in dem Referenz-Block-Bild (1904) dargestellt ist. Eine Bild-Block-Bildung in der Blockbildungseinrichtung 2 (102) ist allerdings nicht auf Blöcke von 8 × 8 Pixeln oder 16 × 16 Pixeln beschränkt.
  • Der Ziel-Block (2002), dargestellt in 20, ist ein Block, der von dem Block-Ziel-Bild (1905) genommen ist. Der Referenz-Block (2001), der dargestellt ist, ist ein Block, genommen von dem Block-Referenz-Bild (1904), der den Referenz-Block (2002) anpasst. Die Exklusiv-ODER-Block-Konstruiereinrichtung (103) tastet den Ziel-Block (2002) und den Referenz-Block (2001) von oben links nach unten rechts ab, verarbeitet die Werte der Pixel dazwischen mit Exklusiv-ODER und konstruiert dadurch den Exklusiv-ODER-Block (2003). Der Exklusiv-ODER-Block (2003), der aus Ziffern 0 und 1 besteht, wird durch die Exklusiv-ODER-Codiereinrichtung (104) unter Verwendung einer Technik, die allgemein als arithmetisches Codieren bekannt ist, codiert. Ein arithmetisches Codieren wird kurz nachfolgend beschrieben werden (unter Bezugnahme auf Hiroshi Yasuda, "International Standards for Multimedia Encoding", Chapter 3, Arithmetic Coding, veröffentlicht von Maruzen).
  • 21 zeigt ein Diagramm zum Erläutern des Prinzips einer arithmetischen Codierung. Beim arithmetischen Codieren, unter Verwendung einer Symbol-Folge (2105) und eines Symbol-Erzeugungs-Wahrscheinlichkeits-Modells (2104), wird eine Zahlen-Linie bzw. -Reihe (2101) von 0 bis 1 aufeinanderfolgend mit jeder Eingabe eines Symbols von der Symbol-Folge (2105) begrenzt, und der kürzeste, binäre Punkt (2103), der nicht außerhalb des erhaltenen Bereichs (2102) geht, wird, was auch immer als nächstes folgt, als die codierten Daten ausgegeben.
  • 22 stellt ein Flußdiagramm für ein arithmetisches Codieren dar. Bei 2201 wird ein arithmetisches Codieren gestartet. Bei 2202 wird der Bereich auf ein Intervall, begrenzt durch 0 und 1, initialisiert. In 2203 wird ein Symbol eingegeben. In 2203 wird ein Erzeugungs-Wahrscheinlichkeits-Modell dem momentanen Bereich zugeordnet und der Wahr scheinlichkeits-Bereich des Eingabe-Symbols wird als der neue Bereich eingestellt. In 2205 wird, falls das Symbol ein End-Symbol ist, dann in 2206 der Bereich durch einen binären Punkt, der ausgegeben wird, ausgedrückt, und das arithmetische Codieren wird in 2207 beendet. Falls, in 2205, das Symbol nicht ein End-Symbol ist, dann wird das nächste Symbol in 2203 eingegeben. Falls die Zahl von Symbolen vorbestimmt ist, kann das End-Symbol weggelassen werden.
  • Ein Decodieren wird durch Bestimmen der Symbol-Folge von dem binären Punkt durchgeführt. Es ist bekannt, dass ein arithmetisches Codieren die Eigenschaft besitzt, dass, je besser das Symbol das Erzeugungs-Wahrscheinlichkeits-Modell des Symbols anpasst, und je mehr die Symbol-Erzeugungs-Wahrscheinlichkeit vorgespannt ist, desto weniger die Code-Bits, um die Symbol-Folge zu codieren, sind. Es ist auch bekannt, dass gerade dann, wenn das Erzeugungs-Wahrscheinlichkeits-Modell während des Codierens geändert wird, ein Decodieren vorgenommen werden kann, wenn die Art und Weise, in der das Modell geändert ist, bekannt ist.
  • Unter Verwendung der vorstehend beschriebenen, arithmetischen Codierung und eines Erzeugungs-Wahrscheinlichkeits-Modells mit [0, 0,9) als Symbol 0 und [0,9, 1,0) als Symbol 1, erzeugt die Exklusiv-ODER-Codiereinrichtung (104) eine codierte Sequenz für den Exklusiv-ODER-Block, der aus einer Symbol-Folge aus den Ziffern 0 und 1 besteht, und gibt dieselbe als codierte Daten aus.
  • Wie vorstehend beschrieben ist, kann, in der vorliegenden Ausführungsform, eine effiziente Codierung mit weniger Code-Bits unter Verwendung der Eigenschaft erreicht werden, dass in dem Fall eines Masken-Bewegungs-Bilds oder dergleichen die Erzeugungs-Wahrscheinlichkeiten von Symbol 0 und Symbol 1 von der Exklusiv-ODER-Bildung des Ziel-Blocks und des Referenz-Blocks bei einem Verhältnis von ungefähr 9 : 1 vorliegen, und durch Kombinieren der Exklusiv-ODER-Bildung mit der arithmetischen Codierung.
  • (Ausführungsform A2)
  • 2 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist eine Exklusiv-ODER-Decodiereinrichtung (201) eine Einrichtung, die die codierten Daten als eine Eingabe aufnimmt und sie decodiert, um den Exklusiv-ODER- Block zurückzugewinnen. Eine Blockbildungseinrichtung 2 (202) ist eine Einrichtung, die ein zuvor erhaltenes Referenz-Bild in Referenz-Blöcke unterteilt, von denen jeder aus einer Mehrzahl von Pixeln besteht. Eine Ziel-Block-Konstruiereinrichtung (203) ist eine Einrichtung, die den Ziel-Block von dem Exklusiv-ODER-Block, zugeführt von der Exklusiv-ODER-Decodiereinrichtung (201), und einen Referenz-Block, zugeführt von der Blockbildungseinrichtung (202), zurückgewinnt.
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Erfindung wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Decodierverfahren, beschrieben werden.
  • Die Exklusiv-ODER-Decodiereinrichtung (201) ist ein Decodierer für eine arithmetische Codierung, die ein Erzeugungs-Wahrscheinlichkeits-Modell mit [0, 0,9) als Symbolziffer 0 und [0,9, 1,0) als Symbol 1 besitzt, wie dies die Exklusiv-ODER-Codiereinrichtung (104) vornimmt. Der Exklusiv-ODER-Block wird durch Erzeugen einer Symbol-Folge von dem binären Punkt aus als die codierten Daten und dem Erzeugungs-Wahrscheinlichkeits-Modell und durch Anordnen der Symbole in der Abtastrichtung konstruiert.
  • Im Betrieb ist die Blockbildungseinrichtung 2 (202) äquivalent zu der Blockbildungseinrichtung 2 (102). Die Ziel-Block-Bildungs-Konstruiereinrichtung (203) konstruiert den Ziel-Block durch Abtasten des Exklusiv-ODER-Blocks und des Referenz-Blocks und durch Invertieren von Pixel-Werten in den Referenz-Block für Pixel, deren Werte in dem Exklusiv-ODER-Block 1 sind.
  • Wie vorstehend beschrieben ist, kann, bei der vorliegenden Ausführungsform, eine effiziente Decodierung mit weniger Code-Bits durch Verwenden der Eigenschaft, dass in dem Fall einer Maske, die ein Bild bewegt oder dergleichen, die Erzeugungs-Wahrscheinlichkeiten eines Symbols 0 und eines Symbols 1 von der Exklusiv-ODER-Verarbeitung des Ziel-Blocks und des Referenz-Blocks bei einem Verhältnis von ungefähr 9 : 1 vorliegt, und durch Kombinieren der Exklusiv-ODER-Verarbeitung mit der arithmetischen Codierung, erreicht werden.
  • (Ausführungsform A3)
  • 3 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist eine Blockbildungseinrichtung 1 (301) eine Einrichtung, die eine Eingabe eines Ziel-Bilds, das codiert werden soll, aufnimmt, und die das Eingabe-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine eine Bewegung abschätzende Einrichtung (305) ist eine Einrichtung, die durch ein Referenz-Bild hindurch nach einem Block sucht, der den Ziel-Block zusammenstellt, und die einen Bewegungs-Vektor für den Block erzeugt. Die bewegungs-kompensierte Blockbildungseinrichtung 2 (302) ist eine Einrichtung, die das Referenz-Bild und Bewegungsinformationen als Eingabe aufnimmt, basierend auf Bewegungsinformationen, das Eingabe-Referenz-Bild in Blöcke unterteilt, von denen jeder aus einer Mehrzahl von Pixeln besteht. Eine Exklusiv-ODER-Block-Konstruiereinrichtung (303) ist eine Einrichtung, die einen Exklusiv-ODER-Block durch Abtasten eines Ziel-Blocks konstruiert, genommen von dem Bild, unterteilt durch die Blockbildungseinrichtung 1 (301), und einen Referenz-Block, genommen von dem Bild, unterteilt durch die in bewegungs-kompensierte Blockbildungseinrichtung 2 (302), und durch Exklusiv-ODER-Verarbeitung von Pixel-Werten dazwischen. Die Exklusiv-ODER-Codiereinrichtung (304) ist eine Einrichtung, die den Exklusiv-ODER-Block codiert und die codierten Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Erfindung wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Codierverfahrens, beschrieben werden.
  • Im Betrieb ist die Blockbildungseinrichtung 1 (301) äquivalent zu der Blockbildungseinrichtung 1 (101). Wenn der Bewegungs-Vektor, der abgeschätzt werden soll, mit v bezeichnet wird, die Zahl von Pixeln in dem Ziel-Block mit m, die Stelle jedes Pixels in dem Bild mit u_i (i ist 1 bis m), der Pixel-Wert an der Stelle x in dem Ziel-Bild mit A(x) und der Pixel-Wert an der Stelle x in dem Referenz-Bild mit B(x) bezeichnet wird, erfasst die Bewegungs-Abschätzeinrichtung (305) von innerhalb eines vorbestimmten Bereichs das v, das die Similarität S(v) (Gleichung A1) minimiert, und gibt das v als den Bewegungs-Vektor aus.
  • (Gleichung A1)
    Figure 00190001
  • Die bewegungs-kompensierte Blockbildungseinrichtung (302) bewegt den Block, genommen von dem Referenz-Bild, durch den Bewegungs-Vektor und erzeugt den Refe renz-Block, der ausgegeben wird. Im Betrieb ist die Exklusiv-ODER-Block-Konstruiereinrichtung (303) äquivalent zu der Exklusiv-ODER-Block-Konstruiereinrichtung (103). Die Exklusiv-ODER-Codiereinrichtung (304) ist äquivalent zu der Exklusiv-ODER-Codiereinrichtung (104).
  • Wie vorstehend beschrieben ist, kann, gemäß der vorliegenden Ausführungsform, eine effiziente Codierung mit weniger Code-Bits unter Verwendung der Bewegungs-Abschätzeinrichtung und der bewegungs-kompensierten Blockbildungseinrichtung und durch Anwenden einer Bewegungs-Kompensation auf einen Block, für den sich die Erzeugungs-Wahrscheinlichkeiten von Symbol 0 und Symbol 1 in dem Exklusiv-ODER-Block stark von dem Bereich von 9 : 1 unterscheiden in einer solchen Art und Weise erreicht werden, dass das Verhältnis der Erzeugungs-Wahrscheinlichkeiten näher zu 9 : 1 gebracht wird.
  • (Ausführungsform A4)
  • 4 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer Ausführungsform darstellt, die zum Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist eine Exklusiv-ODER-Decodiereinrichtung (401) eine Einrichtung, die die codierten Daten als eine Eingabe aufnimmt und sie decodiert, um den Exklusiv-ODER-Block zurückzugewinnen. Eine bewegungs-kompensierte Blockbildungseinrichtung 2 (402) ist eine Einrichtung, die ein Referenz-Bild und die Bewegungsinformationen als Eingaben aufnimmt und die, basierend auf den Bewegungsinformationen, das Eingabe-Referenz-Bild in Blöcke unterteilt, von denen jeder aus einer Mehrzahl von Pixeln besteht. Eine Ziel-Block-Konstruiereinrichtung (403) ist eine Einrichtung, die den Ziel-Block von dem Exklusiv-ODER-Block, zugeführt von der Exklusiv-ODER-Decodiereinrichtung (401), und einen Referenz-Block, zugeführt von der bewegungs-kompensierten Blockbildungseinrichtung (402), zurückgewinnt.
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Ausführung wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Decodierverfahrens, beschrieben werden.
  • Im Betrieb ist die Exklusiv-ODER-Decodiereinrichtung (401) äquivalent zu der Exklusiv-ODER-Decodiereinrichtung (201). Die bewegungs-kompensierte Blockbildungsein richtung 2 (402) ist äquivalent zu der bewegungs-kompensierten Blockbildungseinrichtung 2 (302). Die Ziel-Block-Konstruiereinrichtung (403) ist äquivalent zu der Ziel-Block-Konstruiereinrichtung (203).
  • Wie vorstehend beschrieben ist, kann, gemäß der vorliegenden Ausführungsform, ein effizientes Decodieren mit weniger Code-Bits unter Verwendung der Bewegungs-Abschätzeinrichtung und der bewegungs-kompensierten Blockbildungseinrichtung und Anwenden einer Bewegungskombination auf einen Block, bei dem die Erzeugungs-Wahrscheinlichkeiten von Symbol 0 und Symbol 1 in dem Exklusiv-ODER-Block sich weit von dem Verhältnis von 9 : 1 unterscheidet, erreicht werden, in einer solchen Art und Weise, dass das Verhältnis der Erzeugungs-Wahrscheinlichkeiten näher zu 9 : 1 gebracht wird.
  • (Ausführungsform A5)
  • 5 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer Ausführungsform darstellt, die für das Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist eine Blockbildungseinrichtung 1 (501) eine Einrichtung, die eine Eingabe eines Ziel-Bilds, das codiert werden soll, aufnimmt, und die das Eingabe-Bild in Blöcke unterteilt, von denen jeder aus einer Mehrzahl von Pixeln besteht. Die Blockbildungseinrichtung 2 (502) ist eine Einrichtung, die ein Referenz-Bild als eine Eingabe aufnimmt und das Eingabe-Referenz-Bild in Blöcke unterteilt, von denen jeder aus einer Mehrzahl von Pixeln besteht. Eine Exklusiv-ODER-Block-Konstruiereinrichtung (503) ist eine Einrichtung, die einen Exklusiv-ODER-Block durch Abtasten eines Ziel-Blocks, genommen von dem Bild, unterteilt durch die Blockbildungseinrichtung 1 (501), und eines Referenzblocks, genommen von dem Bild, unterteilt durch die Blockbildungseinrichtung 2 (502) und durch eine Exklusiv-ODER-Verarbeitung von Pixel-Werten dazwischen, konstruiert. Die Exklusiv-ODER-Codiereinrichtung (504) ist eine Einrichtung, die den Exklusiv-ODER-Block codiert und die codierten Daten ausgibt. Eine Referenz-Block-Adoption-Bestimmungseinrichtung (505) ist eine Einrichtung, die den Ziel-Block mit dem Referenz-Block vergleicht und die ein Referenz-Block-Adoption-Bestimmungssignal zum Umschalten der darauffolgenden Verarbeitung ausgibt. Eine Ziel-Pixel-Codiereinrichtung (506) ist eine Einrichtung, die den Ziel-Block codiert und die codierten Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Ausführungsform wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Codierverfahrens, beschrieben werden.
  • Im Betrieb ist die Blockbildungseinrichtung 1 (501) äquivalent zu der Blockbildungseinrichtung 1 (101). Die Blockbildungseinrichtung 2 (502) ist äquivalent zu der Blockbildungseinrichtung 2 (102). Die Referenz-Block-Adoption-Bestimmungseinrichtung (505) gibt das Referenz-Block-Adoption-Bestimmungssignal zum Umschalten der Verarbeitung, basierend auf der Summe der absoluten Differenzen (SAD) zwischen dem Ziel-Block und dem Referenz-Block, in einer solchen Art und Weise aus, dass ein Codieren unter Verwendung der Ziel-Pixel-Codiereinrichtung (506) durchgeführt wird, wenn die Summe der absoluten Differenzen größer als oder gleich zu einem Schwellwert ist, und unter Verwendung der Exklusiv-ODER-Block-Konstruiereinrichtung (503) und der Exklusiv-ODER-Codiereinrichtung (504), falls die Summe der absoluten Differenzen geringer als der Schwellwert ist. Hierbei wird 5 als der Schwellwert verwendet. Im Betrieb ist die Exklusiv-ODER-Block-Konstruiereinrichtung (503) äquivalent zu der Exklusiv-ODER-Kunstruiereinrichtung (103). Die Exklusiv-ODER-Codiereinrichtung (504) ist äquivalent zu der Exklusiv-ODER-Codiereinrichtung (104). Die Ziel-Pixel-Codiereinrichtung (506) ist im Wesentlichen äquivalent zu der Exklusiv-ODER-Codiereinrichtung (504), und ist eine arithmetische Codiereinrichtung, die den Ziel-Block als eine Eingabe aufnimmt und ein Erzeugungs-Wahrscheinlichkeits-Modell mit [0, 0,5] als Symbol 0 und [0,5, 1,0) als Symbol 1 besitzt Wie vorstehend beschrieben ist, werden, gemäß der vorliegenden Ausführungsform, Blöcke, für die sich die Erzeugungs-Wahrscheinlichkeiten von Symbol 0 und Symbol 1 stark von dem Verhältnis von 9 : 1 unterscheiden, als Blöcke angesehen, die große Summen von absoluten Differenzen ergeben, und die Referenz-Block-Adoption-Bestimmungseinrichtung ändert das Codier-Schema, um die Anzahl von Blöcken, die bei einem Codieren ineffizient sind, zu reduzieren, um dadurch eine effiziente Codierung mit weniger Code-Bits zu erreichen.
  • (Ausführungsform A6)
  • 6 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer Ausführungsform darstellt, die zum Verständnis der vor liegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist eine Exklusiv-ODER-Decodiereinrichtung (601) eine Einrichtung, die die codierten Daten als eine Eingabe aufnimmt und sie decodiert, um den Exklusiv-ODER-Block zurückzugewinnen. Eine Blockbildungseinrichtung 2 (602) ist eine Einrichtung, die ein Referenz-Bild als eine Eingabe aufnimmt und die das Eingabe-Referenz-Bild in Blöcke unterteilt, von denen jeder aus einer Mehrzahl von Pixeln besteht. Eine Ziel-Block-Konstruiereinrichtung (603) ist eine Einrichtung, die als Eingänge den Exklusiv-ODER-Block, zugeführt von der Exklusiv-ODER-Decodiereinrichtung (601), und einen Referenz-Block, zugeführt von der Blockbildungseinrichtung (602), aufnimmt und die dadurch den Ziel-Block zurückgewinnt. Die Referenz-Block-Adoption-Steuereinrichtung (604) ist eine Einrichtung, die die darauffolgende Verarbeitung entsprechend dem Referenz-Block-Adoption-Bestimmungssignal umschaltet. Die Ziel-Pixel-Decodiereinrichtung (605) ist eine Einrichtung, die die codierten Daten decodiert und den Ziel-Block zurückgewinnt.
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Ausführungsform wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Decodierverfahrens, beschrieben werden.
  • Im Betrieb ist die Exklusiv-ODER-Decodiereinrichtung (601) äquivalent zu der Exklusiv-ODER-Decodiereinrichtung (201). Die Blockbildungseinrichtung 2 (602) ist äquivalent zu der Blockbildungseinrichtung 2 (102).
  • Die Ziel-Block-Konstruiereinrichtung (603) ist äquivalent zu der Ziel-Block-Konstruiereinrichtung (203). Die Referenz-Block-Adoption-Steuereinrichtung (604) schaltet, basierend auf dem Referenz-Block-Adoption-Bestimmungssignal, die darauffolgende Verarbeitung zwischen der Ziel-Block-Konstruiereinrichtung (603) und der Blockbildungseinrichtung 2 (602), wenn der Referenz-Block verwendet wird und die Ziel-Pixel-Decodiereinrichtung (605) verwendet wird, wenn nicht der Referenz-Block verwendet wird, um.
  • Die Ziel-Pixel-Decodiereinrichtung (605) ist ein Decodieren für ein arithmetisches Codieren, das ein Erzeugungs-Wahrscheinlichkeits-Modell mit [0, 0,5) als Symbol 0 und [0,5, 1,0) als Symbol 1 besitzt, wie dies auch bei der Ziel-Pixel-Codiereinrichtung (506) der Fall ist. Der Ziel-Block ist durch Erzeugen einer Symbol-Folge von dem binären Punkt als die codierten Daten und das Erzeugungs-Wahrscheinlichkeits-Modell und durch Anordnen der Symbole in der Abtastrichtung konstruiert.
  • Wie vorstehend beschrieben ist, werden, gemäß der vorliegenden Ausführungsform, Blöcke, für die sich die Erzeugungs-Wahrscheinlichkeiten von Symbol 0 und Symbol 1 stark von dem Verhältnis von 9 : 1 unterscheiden, als Blöcke angesehen, die große Summen von absoluten Differenzen ergeben, und die Referenz-Block-Adoption-Steuereinrichtung ändert das Codier-Schema, um die Zahl von Blöcken, die beim Codieren ineffizient sind, zu reduzieren, um dadurch eine effiziente Decodierung mit weniger Code-Bits zu erreichen.
  • (Ausführungsform A7)
  • 7 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist eine Blockbildungseinrichtung 1 (701) eine Einrichtung, die eine Eingabe eines Bild, das codiert werden soll, aufnimmt, und die das Eingabe-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht.
  • Die Blockbildungseinrichtung 2 (702) ist eine Einrichtung, die ein Referenz-Bild als eine Eingabe aufnimmt und das Eingabe-Referenz-Bild in Blöcke unterteilt, von denen jeder aus einer Mehrzahl von Pixeln besteht. Die Statistik-Modell-Auswahleinrichtung (703) ist eine Einrichtung, die als Eingaben die Stelle des Ziel-Pixels, das codiert werden soll, einen Referenz-Block und eine Statistik-Modell-Tabelle, die nachfolgend beschrieben wird, aufnimmt, und die ein statistisches Modell von der Statistik-Modell-Tabelle (704) entsprechend den Zuständen der Pixel, die die entsprechende Stelle des Ziel-Pixels in dem Referenz-Block umgeben, auswählt, und das ausgewählte Modell einer Entropie-Codiereinrichtung (705) zuführt. Das bedeutet, dass die Statistik-Modell-Auswahleinrichtung (703) eine Einrichtung ist, die ein statistisches Modell aus einer Mehrzahl von statistischen Modellen auswählt, basierend auf den Zuständen der Pixel, die ein Referenz-Pixel in dem Referenz-Block umgeben, der dem Ziel-Pixel in dem Ziel-Block entspricht. Die Entropie-Codiereinrichtung (705) ist eine Einrichtung, die die Stelle des Ziel-Pixels, das codiert werden soll, zu der Statistik-Modell-Auswahleinrichtung (703) zuführt, und die entropie-mäßig den Ziel-Block basierend auf dem statistischen Modell codiert, zu geführt von der Statistik-Modell-Auswahleinrichtung (703), und denselben als codierte Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Erfindung wird nachfolgend, zusammen mit der Betriebsweise des Bild-Codierverfahrens, beschrieben werden.
  • Im Betrieb ist die Blockbildungseinrichtung 1 (701) äquivalent zu der Blockbildungseinrichtung 1 (101). Die Blockbildungseinrichtung 2 (702) ist äquivalent zu der Blockbildungseinrichtung 2 (102).
  • Die Statistik-Modell-Auswahleinrichtung (703) wählt ein statistisches Modell aus einer Mehrzahl von statistischen Modellen aus und führt das ausgewählte Modell zu der Entropie-Codiereinrichtung (705) zu. Die Statistik-Modell-Tabelle (2301) ist eine Tabelle, in der ein Index zu jedem umgebenden Pixel-Zustand zugeordnet wird und ein statistisches Modell zu jedem Index zugeordnet ist, wie in den 23 bis 26 dargestellt ist. Eine Korrespondenz wird zwischen dem Zustand und dem Index unter Bezugnahme auf die 27 und 28 beschrieben.
  • Da die Zustände der Pixel, die das entsprechende Pixel umgeben, berücksichtigt werden, wird zuerst der Referenz-Block (2401) extrapoliert, um einen extrapolierten Referenz-Block zu erzeugen.
  • In einem Verfahren einer Erzeugung werden, falls die Werte der umgebenden Pixel von dem Referenz-Bild erhalten werden, diese Pixel addiert, um den extrapolierten Referenz-Block (2402) zu erzeugen. In der vorliegenden Ausführungsform wird dieses Verfahren als das Extrapolationsverfahren 1 bezeichnet.
  • Falls die Werte der umgebenden Pixel nicht von dem Referenz-Bild erhalten werden, werden die Pixel in der äußeren Peripherie des Referenz-Blocks einfach nach außen erweitert, um den extrapolierten Referenz-Block (2403) zu erzeugen. Dieses Verfahren wird als das Extrapolationsverfahren 2 bezeichnet. In einer ähnlichen Art und Weise wird ein extrapolierter Ziel-Block von dem Ziel-Block erzeugt.
  • Die Zustände von Pixeln, die die entsprechende Stelle des Ziel-Pixels in dem Referenz-Block umgeben, werden durch Anwenden einer Referenz-Maske (2503) auf den Referenz-Block (2501) und einer Ziel-Maske (2504) auf den Ziel-Block (2502) erhalten, wie in 28 dargestellt ist. Wenn die Pixel-Werte an den jeweiligen Stellen in der Referenz-Maske (2503) und der Ziel-Maske (2504) bezeichnet werden mit A, B, C, D, E, F, G, H, I, J, K, L und M, wie in 28 dargestellt ist, wird ein Index i durch die Gleichung A2 nachfolgend ausgedrückt.
  • In 28 ist das Ziel-Pixel, das als nächstes codiert werden soll, mit dem Bezugszeichen 2502a bezeichnet, und das Referenz-Pixel, entsprechend zu dem Ziel-Pixel (2502a), ist mit dem Bezugszeichen 2501a bezeichnet. Um auch die Zustände von bereits codierten Pixeln in der Nachbarschaft des Ziel-Pixels (2502a) in dem Ziel-Block zu berücksichtigen, erhält die Statistik-Modell-Auswahleinrichtung (703) der vorliegenden Ausführungsform die Zustände von Pixeln in der Nachbarschaft des Ziel-Pixels (2502a) in derselben Art und Weise, wie dies vorstehend beschrieben ist, unter Verwendung des extrapolierten Ziel-Blocks. Dies ergibt eine geeignetere Auswahl des statistischen Modells als dann, wenn Zustände von umgebenden Pixeln nur in dem Referenz-Block verwendet werden. Es ist natürlich möglich, die Konfiguration zu verwenden, bei der Zustände von umgebenden Pixeln nur in dem Referenz-Block verwendet werden.
  • (Gleichung A2)
    • i = B + 2D + 4E + 8F + 16H + 32K + 64M (2)
  • Zu diesem Zeitpunkt wird das statistische Modell entsprechend zu dem Index i in der Statistik-Modell-Tabelle (2301) ausgewählt.
  • Auf diese Art und Weise wählt die Statistik-Modell-Auswahleinrichtung (703) ein statistisches Modell von der Statistik-Modell-Tabelle aus und führt das ausgewählte Modell zu der Entropie-Codiereinrichtung (705) zu.
  • Die Entropie-Codiereinrichtung (705) verwendet eine arithmetische Codiereinrichtung, wie in der Exklusiv-ODER-Codiereinrichtung (104), allerdings verwendet die arithmetische Codiereinrichtung hier als das Erzeugungs-Wahrscheinlichkeits-Modell das statistische Modell (704), ausgewählt durch die Statistik-Modell-Auswahleinrichtung (703), und codiert das Ziel-Pixel unter Verwendung des ausgewählten statistischen Modells.
  • Wie vorstehend beschrieben ist, wird, gemäß der vorliegenden Ausführungsform, das statistische Modell durch die Statistik-Modell-Auswahleinrichtung entsprechend den Zuständen der Pixel, die die entsprechende Stelle des Ziel-Pixels in dem Referenz-Block umgeben, geändert; dies erhöht die Effektivität einer Entropie-Codierung und erzielt eine effiziente Codierung mit weniger Code-Bits.
  • (Ausführungsform A8)
  • 8 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist eine Blockbildungseinrichtung 2 (802) eine Einrichtung, die ein Referenz-Bild als eine Eingabe heranzieht, und die das Eingabe-Referenz-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine Statistik-Modell-Auswahleinrichtung (803) ist eine Einrichtung, die als Eingaben die Stelle des Ziel-Pixels, das codiert werden soll, einen Referenz-Block und die Statistik-Modell-Tabelle heranzieht, und die ein statistisches Modell von der Statistik-Modell-Tabelle (804) entsprechend den Zuständen der Pixel, die die entsprechende Stelle des Ziel-Pixels in dem Referenz-Block umgeben, auswählt, und das ausgewählte Modell zu einer Entropie-Decodiereinrichtung (801) zuführt. Die Entropie-Decodiereinrichtung (801) ist eine Einrichtung, die die codierten Daten als eine Eingabe aufnimmt, und die, basierend auf dem statistischen Modell (804), die codierten Daten decodiert und den Ziel-Block zurückgewinnt.
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Erfindung wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Decodierverfahrens, beschrieben werden.
  • Im Betrieb ist die Blockbildungseinrichtung 2 (802) äquivalent zu der Blockbildungseinrichtung 2 (102). Die Statistik-Modell-Auswahleinrichtung (803) ist äquivalent zu der Statistik-Modell-Auswahleinrichtung (703).
  • Die Entropie-Decodiereinrichtung (801) verwendet einen arithmetischen Decodieren, wie in der Exklusiv-ODER-Decodiereinrichtung (201), allerdings verwendet der arithmetische Decodieren hier das statistische Modell (804), ausgewählt durch die Statistik-Modell-Auswahleinrichtung (803). Die Statistik-Modell-Tabelle (804) ist äquivalent zu der Statistik-Modell-Tabelle (704).
  • Wie vorstehend beschrieben ist, wird, gemäß der vorliegenden Ausführungsform, das statistische Modell durch die Statistik-Modell-Auswahleinrichtung entsprechend den Zuständen der Pixel, die die entsprechende Stelle des Ziel-Pixels in dem Referenz-Block umgeben, geändert; dies erhöht die Effektivität einer Entropie-Codierung und erzielt eine effiziente Decodierung mit weniger Code-Bits.
  • (Ausführungsform A9)
  • 9 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist eine Blockbildungseinrichtung 1 (901) eine Einrichtung, die als eine Eingabe ein Ziel-Bild, das codiert werden soll, aufnimmt und das Eingabe-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht.
  • Eine Bewegungs-Abschätzeinrichtung (906) ist eine Einrichtung, die durch ein Referenz-Bild nach einem Block sucht, der den Ziel-Block zusammenstellt, und die einen Bewegungs-Vektor für den Block erzeugt. Eine bewegungs-kompensierte Blockbildungseinrichtung 2 (902) ist eine Einrichtung, die das Referenz-Bild und Bewegungsinformationen als Eingaben aufnimmt, basierend auf Bewegungsinformationen, das Eingabe-Referenz-Bild in Blöcke unterteilt, von denen jeder aus einer Mehrzahl von Pixeln besteht. Die Statistik-Modell-Auswahleinrichtung (903) ist eine Einrichtung, die als Eingaben die Stelle des Ziel-Pixels, das codiert werden soll, einen Referenz-Block und eine Statistik-Modell-Tabelle heranzieht, und die ein statistisches Modell von der Statistik-Modell-Tabelle (904) entsprechend den Zuständen der Pixel, die die entsprechende Stelle des Ziel-Pixels in dem Referenz-Block umgeben, auswählt, und das ausgewählte Modell zu einer Entropie-Codiereinrichtung (905) zuführt. Die Entropie-Codiereinrichtung (905) ist eine Einrichtung, die entropie-mäßig den Ziel-Block basierend auf dem statistischen Modell, zugeführt von der Statistik-Modell-Auswahleinrichtung (903), codiert, und dasselbe als codierte Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Erfindung wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Codierverfahrens, beschrieben werden.
  • Im Betrieb ist die Blockbildungseinrichtung 1 (901) äquivalent zu der Blockbildungseinrichtung 1 (101).
  • Die Bewegungs-Abschätzeinrichtung (906) ist äquivalent zu der Bewegungs-Abschätzeinrichtung (305). Die bewegungs-kompensierte Blockbildungseinrichtung 2 (902) ist äquivalent zu der bewegungs-kompensierten Blockbildungseinrichtung 2 (302). Die Statistik-Modell-Auswahleinrichtung (903) ist äquivalent zu der das statistische Modell auswählenden Einrichtung (703). Die Statistik-Modell-Tabelle (904) ist äquivalent zu der Statistik-Modell-Tabelle (704). Die Entropie-Codiereinrichtung (905) ist äquivalent zu der Entropie-Codiereinrichtung (705).
  • Wie vorstehend beschrieben ist, wird, gemäß der vorliegenden Ausführungsform, die die Bewegungs-Abschätzeinrichtung und die bewegungs-kompensierte Blockbildungseinrichtung verwendet, die Genauigkeit des statistischen Modells erhöht, was eine effiziente Codierung mit weniger Code-Bits ergibt.
  • (Ausführungsform A10)
  • 10 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer Ausführungsform der vorliegenden Erfindung darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist die bewegungs-kompensierte Blockbildungseinrichtung 2 (1002) eine Einrichtung, die ein Referenz-Bild und die Bewegungsinformationen als Eingabe aufnimmt, und die, basierend auf den Bewegungsinformationen, das Eingabe-Referenz-Bild in Blöcke unterteilt, wobei jeder davon aus einer Mehrzahl von Pixeln besteht. Die Statistik-Modell-Auswahleinrichtung (1003) ist eine Einrichtung, die als Eingaben die Stelle des Ziel-Pixels, das decodiert werden soll, einen Referenz-Block und eine Statistik-Modell-Tabelle aufnimmt, und die ein statistisches Modell von einer Statistik-Modell-Tabelle (1004) entsprechend den Zuständen der Pixel, die die entsprechende Stelle des Ziel-Pixels in dem Referenz-Block umgeben, auswählt, und das ausgewählte Modell zu einer Entropie-Decodiereinrichtung (1001) zuführt. Die Entropie-Decodiereinrichtung (1001) ist eine Einrichtung, die die codierten Daten als eine Eingabe aufnimmt, und die, basierend auf dem statistischen Modell, die codierten Daten decodiert und den Ziel-Block zurückgewinnt.
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Ausführungsform wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Decodierverfahrens, gemäß einer Ausführungsform der vorliegenden Erfindung beschrieben werden.
  • Im Betrieb ist die bewegungs-kompensierte Blockbildungseinrichtung 2 (1002) äquivalent zu der bewegungs-kompensierten Blockbildungseinrichtung 2 (402). Die Statistik-Modell-Auswahleinrichtung (1003) ist äquivalent zu der das statistische Modell auswählenden Einrichtung (803). Die Entropie-Decodiereinrichtung (1001) ist äquivalent zu der Entropie-Decodiereinrichtung (801). Die Statistik-Modell-Tabelle (1004) ist äquivalent zu der Statistik-Modell-Tabelle (704).
  • Wie vorstehend beschrieben ist, wird, gemäß der vorliegenden Ausführungsform, die die bewegungs-kompensierte Blockbildungseinrichtung 2 verwendet, die Genauigkeit des statistischen Modells erhöht, was eine effiziente Decodierung mit weniger Code-Bits ergibt.
  • (Ausführungsform A11)
  • 11 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist die Blockbildungseinrichtung 1 (1101) eine Einrichtung, die als eine Eingabe ein Ziel-Bild aufnimmt, das codiert werden soll, und das Eingabe-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht.
  • Eine Blockbildungseinrichtung 2 (1102) ist eine Einrichtung, die ein Referenz-Bild als eine Eingabe aufnimmt und das Eingabe-Referenz-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine ein statistisches Modell auswählende Einrichtung (1103) ist eine Einrichtung, die als Eingaben die Stelle des Ziel-Pixels, das codiert werden soll, einen Referenz-Block und eine Statistik-Modell-Tabelle aufnimmt, und die ein statistisches Modell von einer Statistik-Modell-Tabelle (1104) entsprechend den Zuständen der Pixel, die die entsprechende Stelle des Ziel-Pixels in dem Referenz-Block umgeben, auswählt, und das ausgewählte Modell zu einer Entropie-Codiereinrichtung (1105) zuführt. Eine Referenz-Block-Adoption-Bestimmungseinrichtung (1106) ist eine Einrichtung, die den Ziel-Block mit dem Referenz-Block vergleicht, und die ein Referenz-Block-Adoption-Bestimmungssignal zum Umschalten der darauftolgenden Verarbeitung ausgibt. Die Entropie-Codiereinrichtung (1105) ist eine Einrichtung, die entropie-mäßig den Ziel-Block, basierend auf dem statistischen Modell, codiert, und dasselbe als codierte Daten ausgibt. Die Ziel-Pixel-Codiereinrichtung (1107) ist eine Einrichtung, die den Ziel-Block codiert und denselben als codierte Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Erfindung wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Codierverfahrens, beschrieben werden.
  • Im Betrieb ist die Blockbildungseinrichtung 1 (1101) äquivalent zu der Blockbildungseinrichtung 1 (101). Die Blockbildungseinrichtung 2 (1102) ist äquivalent zu der Blockbildungseinrichtung 2 (102). Die Statistik-Modell-Auswahleinrichtung (1103) ist äquivalent zu der das statistische Modell auswählenden Einrichtung (703). Die Statistik-Modell-Tabelle (1104) ist äquivalent zu der Statistik-Modell-Tabelle (704). Die Entropie-Codiereinrichtung (1105) ist äquivalent zu der Entropie-Codiereinrichtung (705). Die Referenz-Block-Adoption-Bestimmungseinrichtung (1106) ist äquivalent zu der Referenz-Block Adoption-Bestimmungseinrichtung (505). Die Ziel-Pixel-Codiereinrichtung (1107) ist äquivalent zu der Ziel-Pixel-Codiereinrichtung (506).
  • Wie vorstehend beschrieben ist, ändert, gemäß der vorliegenden Ausführungsform, die Referenz-Block-Adoption-Bestimmungseinrichtung das Codier-Schema für einen Block, der nicht das statistische Modell anpasst, um dadurch die Zahl von Blöcken, ineffizient beim Codieren, zu reduzieren, und demzufolge eine effiziente Codierung mit weniger Code-Bits zu erreichen.
  • (Ausführungsform A12)
  • 12 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist eine Blockbildungseinrichtung 2 (1202) eine Einrichtung, die ein Referenz-Bild als eine Eingabe heranzieht und die das Eingabe-Referenz-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht.
  • Eine Statistik-Modell-Auswahleinrichtung (1203) ist eine Einrichtung, die als Eingaben die Stelle des Ziel-Pixels, das decodiert werden soll, einen Referenz-Block und die Statistik-Modell-Tabelle heranzieht, und die ein statistisches Modell von der Statistik-Modell-Tabelle (1204) entsprechend den Zuständen der Pixel, die die entsprechende Stelle des Ziel-Pixels in dem Referenz-Block umgeben, auswählt, und das ausgewählte Modell zu einer Entropie-Decodiereinrichtung (1201) zuführt. Die Entropie-Decodiereinrichtung (1201) ist eine Einrichtung, die die codierten Daten als eine Eingabe aufnimmt, und die, basierend auf dem statistischen Modell, die codierten Daten decodiert und den Ziel-Block zurückgewinnt. Die Referenz-Block-Adoption-Steuereinrichtung (1205) ist eine Einrichtung, die den Ziel-Block mit dem Referenz-Block vergleicht und die darauffolgende Verar beitung umschaltet. Die Ziel-Pixel-Decodiereinrichtung (1206) ist eine Einrichtung, die die codierten Daten decodiert und den Ziel-Block zurückgewinnt.
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Erfindung wird nachfolgend, zusammen mit der Betriebsweise des Bild-Decodierverfahrens, beschrieben werden.
  • Im Betrieb ist die Entropie-Decodiereinrichtung (1201) äquivalent zu der Entropie-Decodiereinrichtung (801). Die Blockbildungseinrichtung 2 (1202) ist äquivalent zu der Blockbildungseinrichtung 2 (102). Die Statistik-Modell-Auswahleinrichtung (1203) ist äquivalent zu der das statistische Modell auswählenden Einrichtung (703). Die Statistik-Modell-Tabelle (1204) ist äquivalent zu der Statistik-Modell-Tabelle (704). Die Referenz-Block-Adoption-Steuereinrichtung (1205) ist äquivalent zu der Referenz-Block-Adoption-Steuereinrichtung (604). Die Ziel-Pixel-Decodiereinrichtung (1206) ist äquivalent zu der Ziel-Pixel-Decodiereinrichtung (605).
  • Wie vorstehend beschrieben ist, ändert, gemäß der vorliegenden Ausführungsform, die Referenz-Block-Adoption-Steuereinrichtung das Codier-Schema für einen Block, der nicht das statistische Modell anpasst, um dadurch die Zahl von Blöcken, ineffizient beim Codieren, zu reduzieren, und demzufolge eine effiziente Decodierung mit weniger Code-Bits zu erreichen.
  • (Ausführungsform A13)
  • 13 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist eine Blockbildungseinrichtung 1 (1301) eine Einrichtung, die als eine Eingabe ein Bild, das codiert werden soll, aufnimmt und das Eingabe-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine Blockbildungseinrichtung 2 (1302) ist eine Einrichtung, die ein Referenz-Bild als eine Eingabe aufnimmt und das Eingabe-Referenz-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine ein statistisches Modell abschätzende Einrichtung (1303) ist eine Einrichtung, die ein statistisches Modell für einen Ziel-Block von einem Referenz-Block abschätzt, und die das abgeschätzte Modell in einem statistischen Modell (1304) speichert.
  • Eine Entropie-Codiereinrichtung (1305) ist eine Einrichtung, die Pixel in dem Ziel-Block, basierend auf dem statistischen Modell (1304), codiert und decodierte Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Ausführungsform wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Codierverfahrens, beschrieben werden.
  • Im Betrieb ist die Blockbildungseinrichtung 1 (1301) äquivalent zu der Blockbildungseinrichtung 1 (101). Die Blockbildungseinrichtung 2 (1302) ist äquivalent zu der Blockbildungseinrichtung 2 (102). Die das statistische Modell auswählende Abschätzeinrichtung (1303) schätzt ein statistisches Modell von dem Referenz-Block ab. 29 zeigt ein Diagramm zum Erläutern, wie das statistische Modell durch die das statistische Modell abschätzende Einrichtung (1303) abgeschätzt wird.
  • Die Abschätzung des statistischen Modells beginnt mit Erhalten der Frequenz Z des Symbols 0. Die Frequenz Z wird durch Zählen der Anzahl von Auftretungen des Symbols 0 in dem Referenz-Block und durch Teilen der Zahl durch die Gesamtzahl von Pixeln, 64, erhalten. Die Frequenz Z wird zu der Erzeugungs-Wahrscheinlichkeit des Symbols 0 unter Verwendung einer Konversions-Grafik (2601) konvertiert. In der Konversions-Grafik gilt r = 0,1.
  • Unter Verwendung der Erzeugungs-Wahrscheinlichkeit z, erhalten von der Konversions-Grafik, wird ein statistisches Modell abgeschätzt, indem irgendeine Zahl in [0, z) als das Symbol 0 genommen wird und irgendeine Zahl in [z, 1,0) als das Symbol 1 genommen wird. Das abgeschätzte, statistische Modell wird in dem statistischen Modell (1304) gespeichert.
  • Die Entropie-Codiereinrichtung (1305) codiert, ähnlich der Entropie-Codiereinrichtung (102), den Ziel-Block unter Verwendung eines arithmetischen Codierers und des abgeschätzten, statistischen Modells (1304).
  • Wie vorstehend beschrieben ist, wird, gemäß der vorliegenden Ausführungsform, ein statistisches Modell für die Symbole in dem Ziel-Block von dem Referenz-Block durch die das statistische Modell abschätzende Einrichtung abgeschätzt, um dadurch die Effektivität einer Entropie-Codierung zu erhöhen und um ein effizientes Codieren mit weniger Code-Bits zu erreichen.
  • In der vorliegenden Ausführungsform wird ein statistisches Modell für jeden Ziel-Block erzeugt, allerdings ist die Konfiguration nicht auf die dargestellte Anordnung beschränkt; zum Beispiel kann ein statistisches Modell für jedes Ziel-Pixel erzeugt werden.
  • (Ausführungsform A14)
  • 14 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist eine Blockbildungseinrichtung 2 (1402) eine Einrichtung, die ein Referenz-Bild als eine Eingabe heranzieht und die das Eingabe-Referenz-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine Statistik-Modell-Abschätzeinrichtung (1403) ist eine Einrichtung, die ein statistisches Modell für einen Ziel-Block von einem Referenz-Block abschätzt und das abgeschätzte Modell in einem statistischen Modell (1404) speichert. Eine Entropie-Decodiereinrichtung (1401) ist eine Einrichtung, die die codierten Daten als eine Eingabe aufnimmt, und die, basierend auf dem statistischen Modell (1404), decodiert und den Ziel-Block zurückgewinnt.
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Erfindung wird nachfolgend, zusammen mit der Betriebsweise des Bild-Decodierverfahrens, beschrieben.
  • Im Betrieb ist die Blockbildungseinrichtung 2 (1402) äquivalent zu der Blockbildungseinrichtung 2 (102). Die das statistische Modell abschätzende Einrichtung (1403) ist äquivalent zu der das statistische Modell abschätzenden Einrichtung (1303). Die Entropie-Decodiereinrichtung (1401) decodiert, ähnlich zu der Exklusiv-ODER-Decodiereinrichtung (201), die codierten Daten und gewinnt den Ziel-Block unter Verwendung eines arithmetischen Decodierers und des statistischen Modells, abgeschätzt durch die das statistische Modell abschätzende Einrichtung (1403), zurück.
  • Wie vorstehend beschrieben ist, wird, gemäß der vorliegenden Ausführungsform, ein statistisches Modell für die Symbole in dem Ziel-Block von dem Referenz-Block durch die das statistische Modell abschätzende Einrichtung abgeschätzt, um dadurch die Effektivität einer Entropie-Codierung zu erhöhen und um ein effizientes Decodieren mit weniger Code-Bits zu erreichen.
  • (Ausführungsform A15)
  • 15 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist eine Blockbildungseinrichtung 1 (1501) eine Einrichtung, die als eine Eingabe ein Bild, das codiert werden soll, aufnimmt und das Eingabe-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine Bewegungs-Abschätzeinrichtung (1506) ist eine Einrichtung, die durch ein Referenz-Bild nach einem Block sucht, der einen Ziel-Block wieder zusammenstellt, und die einen Bewegungs-Vektor für den Block erzeugt.
  • Eine bewegungs-kompensierte Blockbildungseinrichtung 2 (1502) ist eine Einrichtung, die das Referenz-Bild und Bewegungsinformationen als Eingaben aufnimmt, und die, basierend auf den Bewegungsinformationen, das Eingabe-Referenz-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht.
  • Die ein statistisches Modell abschätzende Einrichtung (1503) ist eine Einrichtung, die das statistische Modell für einen Ziel-Block von einem Referenz-Block abschätzt und die das abgeschätzte Modell in einem statistischen Modell speichert (1504).
  • Eine Entropie-Codiereinrichtung (1505) ist eine Einrichtung, die Pixel in dem Ziel-Block, basierend auf dem statistischen Modell (1504) codiert, und die codierten Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Erfindung wird nachfolgend zusammen mit der Betriebsweise eines Bild-Codierverfahrens beschrieben werden.
  • Im Betrieb ist die Blockbildungseinrichtung 1 (1501) äquivalent zu der Blockbildungseinrichtung 1 (101). Die bewegungs-kompensierte Blockbildungseinrichtung 2 (1502) ist äquivalent zu der bewegungs-kompensierten Blockbildungseinrichtung 2 (302). Die das statistische Modell abschätzende Einrichtung (1504) ist äquivalent zu der das statistische Modell abschätzende Einrichtung (1303). Die Entropie-Codiereinrichtung (1503) ist äquivalent zu der Entropie-Codiereinrichtung (1305). Die Bewegungs-Abschätzeinrichtung (1506) ist äquivalent zu der Bewegungs-Einschätzungseinrichtung (305).
  • Wie vorstehend beschrieben ist, wird, gemäß der vorliegenden Ausführungsform, die die Bewegungs-Abschätzeinrichtung und die bewegungs-kompensierte Blockbildungseinrichtung verwendet, die Genauigkeit der Abschätzung des statistischen Modells erhöht, um dadurch eine effiziente Codierung mit weniger Code-Bits zu erreichen.
  • (Ausführungsform A16)
  • 16 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist eine bewegungs-kompensierte Blockbildungseinrichtung 2 (1602) eine Einrichtung, die ein Referenz-Bild und die Bewegungsinformationen als Eingaben heranzieht, und die, basierend auf den Bewegungsinformationen, das Eingabe-Referenz-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine Statistik-Modell-Abschätzeinrichtung (1603) ist eine Einrichtung, die ein statistisches Modell für einen Ziel-Block von einem Referenz-Block abschätzt und das abgeschätzte Modell in einem statistischen Modell (1604) speichert. Die Entropie-Decodiereinrichtung (1601) ist eine Einrichtung, die die codierten Daten als eine Eingabe aufnimmt, und die die codierten Daten, basierend auf dem statistischen Modell (1604), decodiert und den Ziel-Block zurückgewinnt.
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Ausführungsform wird nachfolgend, zusammen mit der Betriebsweise des Bild-Decodierverfahrens, beschrieben werden.
  • Im Betrieb ist die bewegungs-kompensierte Blockbildungseinrichtung 2 (1602) äquivalent zu der bewegungs-kompensierten Blockbildungseinrichtung 2 (402). Die das statistische Modell abschätzende Einrichtung (1603) ist äquivalent zu der das statistische Modell abschätzenden Einrichtung (1303). Die Entropie-Decodiereinrichtung (1601) ist äqui- valent zu der Entropie-Decodiereinrichtung (1401).
  • Wie vorstehend beschrieben ist, wird, gemäß der vorliegenden Ausführungsform, unter Verwendung der bewegungs-kompensierten Blockbildungseinrichtung 2, die Genauigkeit einer Abschätzung eines statistischen Modells erhöht, um dadurch eine effiziente Decodierung mit weniger Code-Bits zu erreichen.
  • (Ausführungsform A17)
  • 17 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist eine Blockbildungseinrichtung 1 (1701) eine Einrichtung, die als eine Eingabe ein Bild, das codiert werden soll, aufnimmt und das Eingabe-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine Blockbildungseinrichtung 2 (1702) ist eine Einrichtung, die ein Referenz-Bild als eine Eingabe aufnimmt und das Eingabe-Referenz-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Die das statistische Modell abschätzende Einrichtung (1703) ist eine Einrichtung, die ein statistisches Modell für einen Ziel-Block von einem Referenz-Block abschätzt und das abgeschätzte Modell in einem statistischen Modell (1704) speichert. Eine Entropie-Codiereinrichtung (1705) ist eine Einrichtung, die die Ausgabedaten von der Blockbildungseinrichtung 1 (1701) eingibt und die die Eingabedaten, basierend auf dem statistischen Modell (1704), codiert, und die codierten Daten zurückgewinnt. Die Referenz-Block-Adoption-Bestimmungseinrichtung (1706) ist eine Einrichtung, die den Ziel-Block mit dem Referenz-Block vergleicht und ein Referenz-Block-Adoption-Bestimmungssignal zum Umschalten der darauffolgenden Verarbeitung ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Erfindung wird nachfolgend zusammen mit der Betriebsweise eines Bild-Codierverfahrens beschrieben werden.
  • Im Betrieb ist die Blockbildungseinrichtung 1 (1701) äquivalent zu der Blockbildungseinrichtung 1 (101). Die Blockbildungseinrichtung 2 (1702) ist äquivalent zu der Blockbildungseinrichtung 2 (102). Die das statistische Modell abschätzende Einrichtung (1703) ist äquivalent zu der das statistische Modell abschätzenden Einrichtung (1303). Die Entropie-Codiereinrichtung (1705) ist äquivalent zu der Entropie-Codiereinrichtung (1305). Die Referenz-Block-Adoption-Bestimmungseinrichtung (1706) ist äquivalent zu der Referenz-Block-Adoption-Bestimmungseinrichtung (505). Die Ziel-Pixel-Codiereinrichtung (1707) ist äquivalent zu der Ziel-Pixel-Codiereinrichtung (506).
  • Wie vorstehend beschrieben ist, ändert, gemäß der vorliegenden Ausführungsform, die Referenz-Block-Adoption-Bestimmungseinrichtung das Codier-Schema für einen Block, der nicht das statistische Modell anpasst, um dadurch die Anzahl von Blöcken zu reduzieren, die beim Codieren ineffizient sind, und um so ein effizientes Codieren mit weniger Code-Bits zu erreichen.
  • (Ausführungsform A18)
  • 18 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer Ausführungsform, die zum Verständnis der vorliegenden Erfindung hilfreich ist, darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben.
  • In der Figur ist eine Blockbildungseinrichtung 2 (1802) eine Einrichtung, die ein Referenz-Bild als eine Eingabe aufnimmt, und das Eingabe-Referenz-Bild in Blöcke unterteilt, wobei jeder aus einer Mehrzahl von Pixeln besteht. Eine Statistik-Modell-Abschätzeinrichtung (1803) ist eine Einrichtung, die ein statistisches Modell für einen Ziel-Block von einem Referenz-Block abschätzt und das abgeschätzte Modell in einem statistischen Modell (1804) speichert. Die Entropie-Decodiereinrichtung (1801) ist eine Einrichtung, die die codierten Daten als eine Eingabe aufnimmt, und die die codierten Daten, basierend auf dem statistischen Modell (1804), decodiert und den Ziel-Block zurückgewinnt. Eine Referenz-Block-Adoption-Steuereinrichtung (1805) ist eine Einrichtung, die die darauffolgende Verarbeitung entsprechend dem Referenz-Block-Adoption-Bestimmungssignalumschaltet. Die Ziel-Pixel-Decodiereinrichtung (1806) ist eine Einrichtung, die die codierten Daten decodiert und die decodierten Daten dss Ziel-Pixels aus- gibt.
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Erfindung wird nachfolgend, zusammen mit der Betriebsweise eines Bild-Decodierverfahrens, beschrieben werden.
  • Im Betrieb ist die Blockbildungseinrichtung 2 (1802) äquivalent zu der Blockbildungseinrichtung 2 (102). Die das statistische Modell abschätzende Einrichtung (1803) ist äquivalent zu der das statistische Modell abschätzenden Einrichtung (1303). Die Entropie-Decodiereinrichtung (1801) ist äquivalent zu der Entropie-Decodiereinrichtung (1401). Die Referenz-Block-Adoption-Steuereinrichtung (1805) ist äquivalent zu der Referenz-Block-Adoption-Steuereinrichtung (604). Die Ziel-Pixel-Decodiereinrichtung (1806) ist äquivalent zu der Ziel-Pixel-Decodiereinrichtung (605).
  • Wie vorstehend beschrieben ist, ändert, gemäß der vorliegenden Ausführungsform, die Referenz-Block-Adoption-Steuereinrichtung das Codier-Schema für einen Block, der nicht das statistische Modell anpasst, und um dadurch die Anzahl von Blöcken, die beim Codieren ineffizient sind, zu reduzieren, um so ein effizientes Decodieren mit weniger Code-Bits zu erreichen.
  • In irgendeiner der vorstehend beschriebenen Ausführungsformen kann ein magnetisches Aufzeichnungsmedium oder ein optisches Aufzeichnungsmedium erzeugt werden, das ein Programm hält, um eine Computer-Ausführung der Funktionen aller oder eines Teils der Einrichtungen zu haben, die bis hier beschrieben sind, so dass das Programm auf dem Computer laufen kann, um die vorstehend beschriebenen Operationen auszuführen. In diesem Fall können auch dieselben Effekte, wie sie in Verbindung mit den jeweiligen Ausführungsformen beschrieben sind, erhalten werden.
  • Wie vorstehend beschrieben ist, kann, unter Verwendung der Bild-Decodiervorrichtung und des Bild-Decodierverfahrens der vorliegenden Erfindung, eine effizientere Decodierung erreicht werden, als dann, wenn bekannte, binäre Bild-Decodiertechniken nach dem Stand der Technik verwendet werden, aus den Gründen, die nachfolgend angegeben sind.
    • (1) In einer binären Bewegungs-Bild-Sequenz wird ein Ziel-Bild aus einem Referenz-Bild vorhergesagt, und der Rest wird durch Exklusiv-ODER-Verknüpfungen ausgedrückt.
    • (2) Ein geeignetes, statistisches Modell wird immer durch Ändern des statistischen Modells entsprechend den Zuständen von umgebenden Pixeln in einem anderen Einzelbild, das eine Korrelation besitzt, verwendet.
    • (3) Ein geeignetes, statistisches Modell wird durch Erzeugen eines statistischen Modells von einem Referenz-Bild verwendet.
    • (4) Die Zahl von Blöcken, die nicht das statistische Modell anpasst, wird durch Verwendung einer Bewegungs-Kompensation oder durch Ändern des Codier-Schemas unter Verwendung eines Schwellwerts und einer Summe von absoluten Differenzen reduziert.
  • Die Referenz-Block-Adoption-Bestimmungseinrichtung der vorliegenden Erfindung ist in der fünften Ausführungsform so beschrieben worden, dass sie bei der Konfiguration, dargestellt in 5, angewandt wird, allerdings ist die anwendbare Konfiguration nicht auf die zuvor beschriebene eine eingeschränkt; zum Beispiel ist die Konfiguration, dargestellt in 30, auch anwendbar. Das bedeutet, dass in dem Fall der Bild- Codiervorrichtung, dargestellt in 30, die Referenz-Block-Adoption-Bestimmungseinrichtung 3505 ein Referenz-Block-Adoption-Bestimmungssignal zum Umschalten der darauffolgenden Verarbeitung durch Vergleichen der Anzahl von Code-Bits des Ziel-Blocks mit derjenigen des Referenz-Blocks ausgibt. Dieser Punkt trägt zu dem Hauptunterschied gegenüber der Konfiguration der 5 bei. Genauer gesagt vergleicht die Referenz-Block-Adoption-Bestimmungseinrichtung 3505 die Zahl von Code-Bits, verwendet in der Ziel-Pixel-Codiereinrichtung 506, mit der Zahl von Code-Bits, verwendet in der Exklusiv-ODER-Codiereinrichtung 504, und führt ein Umschalten in einer solchen Art und Weise durch, dass dann, wenn die Zahl von Code-Bits von der Ziel-Pixel-Codiereinrichtung 506 kleiner ist, die codierten Daten von dieser Einrichtung ausgegeben werden, und falls die Zahl von Code-Bits von der Exklusiv-ODER-Codiereinrichtung 504 kleiner ist, werden die codierten Daten von dieser Einrichtung ausgegeben. Weiterhin wird, wenn die Zahl von Code-Bits von der Ziel-Pixel-Codiereinrichtung 506 kleiner ist, das Referenz-Block-Adoption-Bestimmungssignal ausgegeben. Auf diese Art und Weise schaltet, gemäß dieser Ausführungsform, die Referenz-Block-Adoption-Bestimmungseinrichtung 3505 den Ausgang der codierten Daten unter Bezugnahme auf die Zahl von Code-Bits um, um dadurch die Zahl von Blöcken, die ineffizient beim Codieren sind, zu reduzieren, und so eine effiziente Codierung mit einer geringeren Zahl von Code-Bits zu erreichen. In 30 sind Elemente, die grundsätzlich dieselben wie solche in 5 sind, mit denselben Bezugszeichen bezeichnet.
  • Die Referenz-Block-Adoption-Steuereinrichtung der vorliegenden Erfindung ist in der sechsten Ausführungsform so beschrieben worden, dass sie bei der Konfiguration, dargestellt in 6, angewandt wird, allerdings ist die anwendbare Konfiguration nicht auf die zuvor beschriebene eine eingeschränkt; zum Beispiel ist die Konfiguration, dargestellt in 31, auch anwendbar. Das bedeutet, dass die Konfiguration der Bild-Decodiervorrichtung, dargestellt in 31, umfasst: eine Ziel-Pixel-Decodiereinrichtung 605 zum Zurückgewinnen des Ziel-Blocks durch Decodieren des Ausgangs in Form der codierten Daten von der Bild-Codiervorrichtung, dargestellt in 5 oder 30; und eine Referenz-Block-Adoption-Steuereinrichtung 3604 zum Auswählen, basierend auf dem Referenz-Block-Adoption-Bestimmungssignal, ausgegeben von der Bild-Codiervorrichtung, des Ausgangs von der Ziel-Block-Konstruiereinrichtung 603 oder des Ausgangs von der Ziel-Pixel-Decodiereinrichtung 605 für eine Ausgabe als der Ziel-Block.
  • Diese Konfiguration erreicht eine effizientere Decodierung verglichen mit dem Stand der Technik. In 31 sind Elemente, die grundsätzlich dieselben wie solche in 6 sind, mit denselben Bezugszeichen bezeichnet.
  • Die Statistik-Modell-Auswahleinrichtung ist in der siebten Ausführungsform so beschrieben worden, dass sie bei der Konfiguration angewandt wird, in der das Ergebnis der Statistik-Modell-Auswahl nicht zu der Decodiervorrichtung übertragen wird, allerdings ist die anwendbare Konfiguration nicht auf die zuvor beschriebene eine eingeschränkt; zum Beispiel kann, wie in 32 dargestellt ist, die Statistik-Modell-Auswahleinrichtung 3703 so konfiguriert werden, um das Ergebnis der Statistik-Modell-Auswahl als ein Auswahl-Ergebnis-Signal zu der Decodiervorrichtung auszugeben. In 32 sind Elemente, die grundsätzlich dieselben wie solche in 7 sind, mit denselben Bezugszeichen bezeichnet.
  • Die Bild-Decodiervorrichtung ist in der achten Ausführungsform so beschrieben worden, dass sie eine Konfiguration entsprechend zu der Konfiguration der Bild-Codiervorrichtung des Typs besitzt, die nicht das Ergebnis der Statistik-Modell-Auswahl zu der Decodiervorrichtung überträgt, allerdings ist die Konfiguration nicht auf die zuvor beschriebene eine eingeschränkt; zum Beispiel ist die Konfiguration, dargestellt in 33, auch anwendbar. Das bedeutet, die Bild-Decodiervorrichtung, dargestellt in 33, weist auf: eine Statistik-Modell-Auswahleinrichtung 3803 zum Aufnehmen des Auswahl-Ergebnis-Signals, Ausgegeben von der Bild-Codiervorrichtung, dargestellt in 32, und zum Auswählen azs einer Mehrzahl von Statistik-Modellen eines statistischen Modells entsprechend zu dem Auswahl-Ergebnis-Signal; und eine Entropie-Decodiereinrichtung 801 zum Zurückgewinnen des Ziel-Blocks durch eine Entropie-Decodierung des codierten Datenausgangs von der Bild-Codiervorrichtung unter Verwendung des ausgewählten statistischen Modells. Diese Konfiguration erreicht eine effizientere Decodierung, verglichen mit dem Stand der Technik. In dieser Ausführungsform kann eine Blockbildungseinrichtung 2 (802), wie eine solche, die in 8 dargestellt ist, weggelassen werden. In 33 sind Elemente, die grundsätzlich dieselben wie solche in 8 sind, mit denselben Bezugszeichen bezeichnet worden.
  • Die Referenz-Block-Adoption-Bestimmungseinrichtung ist in der 11. Ausführungsform so beschrieben worden, dass sie bei der Konfiguration, dargestellt in 11, angewandt wird, allerdings ist die anwendbare Konfiguration nicht auf die zuvor beschriebene eine eingeschränkt; zum Beispiel ist die Konfiguration, dargestellt in 34, auch anwendbar. Das bedeutet, dass, in dem Fall der Bild-Codiervorrichtung, dargestellt in 34, die Referenz-Block-Adoption-Bestimmungseinrichtung 3106 ein Referenz-Block-Adoption-Bestimmungssignal zum Umschalten der darauffolgenden Verarbeitung, durch Vergleichen der Anzahl von Code-Bits des Ziel-Bits mit derjenigen des Referenz-Blocks, ausgibt. Dieser Punkt trägt zu einem Hauptunterschied gegenüber der Konfiguration der 11 bei. Genauer gesagt vergleicht die Referenz-Block-Adoption-Bestimmungseinrichtung 3106 die Zahl von Code-Bits, verwendet in der Ziel-Pixel-Codiereinrichtung 1107, mit der Zahl von Code-Bits, verwendet in der Entropie-Codiereinrichtung 1105, und führt eine Umschaltung in einer solchen Art und Weise durch, dass dann, wenn die Anzahl von Code-Bits von der Ziel-Pixel-Codiereinrichtung 1107 kleiner ist, die codierten Daten von dieser Einrichtung ausgegeben werden, und falls die Zahl von Code-Bits von der Entropie-Codiereinrichtung 1105 kleiner ist, werden die codierten Daten von dieser Einrichtung ausgegeben. Weiterhin wird, wenn die Zahl von Code-Bits von der Ziel-Pixel-Codiereinrichtung 1107 kleiner ist, das Referenz-Block-Adoption-Bestimmungssignal ausgegeben. In dieser Art und Weise schaltet, gemäß dieser Ausführungsform, die Referenz-Block-Adoption-Bestimmungseinrichtung 3106 den Ausgang der codierten Daten durch Bezugnahme auf die Zahl von Code-Bits um, um dadurch die Anzahl von Blöcken, ineffizient beim Codieren, zu reduzieren, und so eine effiziente Codierung mit einer geringeren Anzahl von Code-Bits zu erreichen. In 34 sind Elemente, die grundsätzlich dieselben wie solche in 11 sind, mit denselben Bezugszeichen bezeichnet worden.
  • Die Referenz-Block-Adoption-Steuereinrichtung ist in der 12. Ausführungsform so beschrieben worden, dass sie bei der Konfiguration, dargestellt in 12, angewandt wird, allerdings ist die anwendbare Konfiguration nicht auf die zuvor beschriebene eine eingeschränkt; zum Beispiel ist die Konfiguration, dargestellt in 35, auch anwendbar. Das bedeutet, dass die Konfiguration der Bild-Decodiervorrichtung, dargestellt in 35 umfaßt: eine Ziel-Pixel-Decodiereinrichtung 1206 zum Zurückgewinnen des Ziel-Blocks durch Decodieren des codierten Datenausgangs von der Bild-Codiervorrichtung, dargestellt in 11 oder 34; und eine Referenz-Block-Adoption-Steuereinrichtung 3205 zum Auswählen, basierend auf dem Referenz-Block-Adoption-Bestimmungssignal, ausgegeben von der Bild-Codiervorrichtung, des Ausgangs von der Entropie-Decodiereinrichtung 1201 oder des Ausgangs von der Ziel-Pixel-Decodiereinrichtung 1206 zur Ausgabe als der Ziel-Block. Diese Konfiguration erreicht eine effizientere Decodierung verglichen mit dem Stand der Technik. In 35 sind Elemente, die grundsätzlich dieselben wie solche in 12 sind, mit denselben Bezugszeichen bezeichnet worden.
  • Jede der vorstehenden Ausführungsformen ist für den Fall beschrieben worden, in dem das (t + 1)-te Einzelbild einer Bewegungs-Bild-Sequenz als das Ziel-Binär-Bild verwendet wird und das t-te Einzelbild als das Referenz-Binär-Bild verwendet wird, allerdings sind die Ausführungsformen nicht auf den dargestellten Fall beschränkt; zum Beispiel kann derselbe Gegenstand durch ein Stereokamera-Paar fotografiert werden, und ein Bild, erfasst durch eine Kamera, und ein Bild, erfasst durch die andere Kamera, zur selben Zeit, können als das Ziel-Binär-Bild und das Referenz-Binär-Bild jeweils verwendet werden. In diesem Fall können auch dieselben Effekte, wie sie in Verbindung mit den jeweiligen Ausführungsformen beschrieben sind, erhalten werden.
  • Wie aus der vorstehenden Beschreibung ersichtlich ist, bietet die vorliegende Erfindung den Vorteil, dass sie in der Lage ist, eine effizientere Codierung als dann zu erreichen, wenn Binär-Bild-Codier-Techniken nach dem Stand der Technik verwendet werden.
  • Weitere Ausführungsformen, die beim Verständnis der vorliegenden Erfindung hilfreich sind, werden nachfolgend unter Bezugnahme auf die Zeichnungen beschrieben werden.
  • (Ausführungsform B1)
  • 36 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer B1. Ausführungsform darstellt, die für das Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist eine einen dynamischen Bereich abschätzende Einrichtung (10101) eine Einrichtung, die ein Ziel-Mehrfach-Wert-Bild als eine Eingabe aufnimmt, den Pixel-Wert des größten Bereichs und den Pixel-Wert des zweiten, größten Bereichs in dem Mehrfach-Wert-Bild extrahiert und die Pixel-Werte als einen dynamischen Bereich ausgibt.
  • Eine eine Glättungs-Funktion abschätzende Einrichtung (10102) ist eine Einrichtung, die das Mehrfach-Wert-Bild und einen dynamischen Bereich als Eingaben aufnimmt und die eine Glättungs-Funktion durch Analysieren von Luminanz-Gradienten in dem Mehrfach-Wert-Bild abschätzt.
  • Eine Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (10103) ist eine Einrichtung, die eine Luminanz-Konversion unter Verwendung des dynamischen Bereichs durchführt und die ein binäres Bild von dem Mehrfach-Wert-Bild unter Verwendung eines Schwellwerts als ein Mehrfach-Wert-zu-Binär-Konversions-Kriterium erzeugt, das so bestimmt wird, dass das Original-Mehrfach-Wert-Bild gut angenähert werden könnte, falls eine Glättung an der entsprechenden Decodiererseite unter Verwendung derselben Glättungsfunktion vorgenommen worden wäre, wie dies vorstehend erwähnt ist. Eine Schwellwertbildung unter Verwendung dieses Schwellwerts wird im Detail in der operationsmäßigen Beschreibung, die nachfolgend angegeben ist, beschrieben werden. Die Glättungsfunktion, abgeschätzt durch die Glättungsfunktion-Abschätzeinrichtung (10102), basierend auf dem Mehrfach-Wert-Bild, ist eine Funktion, die so eingestellt ist, dass das Original-Mehrfach-Wert-Bild tatsächlich oder in einer Annäherungsweise, wiedergegeben werden könnte, falls die Glättungsfunktion auf das entsprechende Binär-Bild an der entsprechenden Decodiererseite angewandt werden würde.
  • Eine einen dynamischen Bereich codierende Einrichtung (10105) ist eine Einrichtung, die den dynamischen Bereich codiert und die codierten Daten ausgibt.
  • Die Binär-Bild-Codiereinrichtung (10104) ist eine Einrichtung, die das binäre Bild codiert und die codierten Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Erfindung wird nachfolgend unter Bezugnahme auf die 36 bis 44 beschrieben werden, zusammen mit der Betriebsweise eines Bild-Codierverfahrens.
  • 37 zeigt ein Diagramm, das ein Ziel-Mehrfach-Wert-Bild darstellt. 38 zeigt ein Verteilungsdiagramm von Pixel-Werten entlang einer Linie A-B in 37. Wie in 37 dargestellt ist, ist der Pixel-Wert von schwarz 255 und der Pixel-Wert von weiß ist 0.
  • Die den dynamischen Bereich abschätzende Einrichtung (10101) extrahiert den Pixel-Wert des größten Bereichs und den Pixel-Wert des zweitgrößten Bereichs in dem Mehrfach-Wert-Bild; in vielen Mehrfach-Wert-Bildern stimmen diese Pixel-Werte mit dem größten Pixel-Wert und dem kleinsten Pixel-Wert jeweils überein, so dass, in der vorliegenden Ausführungsform, der größte Pixel-Wert Dmax und der kleinste Pixel-Wert Dmin durch Abtasten des Ziel-Mehrfach-Wert-Bilds extrahiert werden.
  • Die Glättungsfunktion-Abschätzeinrichtung (10102) ist in 39 dargestellt.
  • Wie in der Figur dargestellt ist, wird, bei einer x-Richtung-Filterung (10301), ein x-Richtung-Filter (10401) angewandt und über das Bild abgetastet, um den Gradienten entlang der x-Richtung in dem Bild zu erfassen.
  • Bei einer y-Richtung-Filterung (10302) wird ein y-Richtung-Filter (10402) angewandt und über das Bild abgetastet, um den Gradienten entlang der y-Richtung in dem Bild zu erfassen.
  • Bei der Gradienten-Erfassung (10303) wird ein Gradient d (i, j) durch Berechnen der folgenden Gleichung B1 unter Verwendung des x-Richtung-Gradienten dx (i, j), erhalten durch die x-Richtung-Filterung (10301), und der y-Richtung-Gradienten dy (i, j), erhalten durch die y-Richtung-Filterung (10302), erfasst, wobei (i, j) die Koordinaten auf dem Bild sind.
  • Gleichung B1
    Figure 00450001
  • Bei der Gradienten-Richtung-Erfassung (10304) wird eine Gradienten-Richtung Θ (i, j) durch Berechnen der folgenden Gleichung B2 unter Verwendung des x-Richtung-Gradienten dx (i, j), erhalten durch die x-Richtung-Filterung (10301), und den y-Richtung-Gradienten dy (i, j), erhalten durch die y-Richtung-Filterung (10302), erfasst, wobei (i, j) die Koordinaten auf dem Bild sind.
  • (Gleichung B2)
    Figure 00450002
  • Bei der Nicht-Maximum-Wert-Unterdrückung (10305), unter Verwendung eines Fensters, das sich mit Θ ändert, wie in 40 dargestellt ist, wird ein Bild in einer solchen Art und Weise erzeugt, dass dann, wenn der Wert des Gradienten an einem Referenz-Punkt innerhalb des Fensters ein Maximal-Wert ist, der Bildbereich an den Koordinaten des Referenz-Punkts einem Wert von 1 zugeordnet wird; ansonsten wird der Bildbereich an den Koordinaten des Referenz-Punkts einem Wert von 0 zugeordnet.
  • In der Durchschnitt-Gradienten-Erfassung (10306) wird ein Durchschnittsgradient d'ave durch Berechnen des Durchschnitts der Gradienten, erfasst in der Gradienten-Erfassung (10303) für die Pixel des Werts 1 in dem binären Bild, erhalten durch die Nicht-Maximum-Wert-Unterdrückung (10305), erhalten. Weiterhin wird, unter Verwendung des maximalen Pixel-Werts Dmax und des minimalen Pixel-Werts Dmin, erfasst durch die den dynamischen Bereich abschätzende Einrichtung (10101), ein normierter Durchschnittsgradient erneut aus Gleichung B3 nachfolgend berechnet, um dave zu erhalten.
  • (Gleichung B3)
    Figure 00460001
  • Die die Glättungsfunktion auswählende Einrichtung (10307) wählt einen Glättungsfilter entsprechend dem durchschnittlichen Gradienten daue aus, wie in 41 dargesetllt ist. Das Detail des Glättungsfilters 1 in 41 ist in 42 dargestellt. In 42 stellt eine eingekreiste Position die Stelle des Pixels, das einer Glättung unterworfen werden soll, dar. Während das Bild abgetastet wird, werden das Ergebnis der Konvolution mit dem Filter 1 (10601), das Ergebnis der Konvolution mit dem Filter 2 (10602), das Ergebnis der Konvolution mit dem Filter 3 (10603), und das Erebnis der Konvolution mit dem Filter 4 (10604) jeweils berechnet, und der kleinste Wert der vier Filter wird als das Ergebnis des Glättungsfilters 1 genommen. In 42 sind a, b, c, d, e, f, g und h jeweils 0,5. Der Glättungsfilter 2 ist ein Filter, der den Glättungsfilter 1 nach Anwenden des Glättungsfilters 1 anwendet.
  • Der Glättungsfilter 3 ist ein Filter, der den Glättungsfilter 1 nach Anwenden des Glättungsfilters 2 anwendet. Wenn daue größer als 191 ist, wird ein Glätten durch den Glättungsfilter nicht angewandt werden, da der Grdient des Bilds dahin angesehen wird, dass er eine Stufenkante darstellt. Andererseits wird, wenn daue kleiner als 10 ist, eine Glättung durch den Glättungsfilter nicht angewandt werden, da er nicht dahingehend angesehen wird, dass dort kein Bild-Gradient vorhanden ist.
  • Die Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (10103) wandelt das Mehrfach-Wert-Bild in ein binäres Bild um, das nur zwei Pixel-Werte, 255 und 0, besitzt, durch Berücksichtigung der Charakteristik der Glättungsfunktion, abgeschätzt durch die die Glättungsfunktion abschätzende Einrichtung (10102). Die Ansprechverhalten auf eindimensionale Stufen des Glättungsfilters 1, des Glättungsfilters 2 und des Glättungsfilters 3 sind in 43 dargestellt; dementsprechend ist die Mehrfach-Wert-zu-Binär-Konversion entsprechend zu dem Glättungsfilter 1, dem Glättungsfilter 2 und dem Glättungsfilter 3 die Schwellwertbildung so, wie dies in 44 dargestellt ist. Deshalb wendet die Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (10103) die Schwellwertbildung, wie dies in 44 dargestellt ist, auf das Mehrfach-Wert-Bild an.
  • Die Binär-Bild-Codiereinrichtung (10104) codiert das binäre Bild unter Verwendung des Binär-Bild-Codierschemas MMR, definiert in dem CCITT International Standard, traditionell verwendet für Facsimile-Systeme, usw., und gibt die codierten Daten aus.
  • Die die Glättungsfunktion codierende Einrichtung (10106) codiert die Glättungsfunktion, abgeschätzt durch die Glättungsfunktion-Abschätzeinrichtung (10102), und gibt die codierten Daten aus. In der vorliegenden Ausführungsform wird, da die Glättungsfunktion unter den drei Glättungsfunktionen ausgewählt ist, die Identifikations-Nummer der ausgewählten Glättungsfunktion codiert, was als die codierten Daten ausgegeben wird.
  • Die den dynamischen Bereich codierende Einrichtung (10105) codiert individuell das Dmax und Dmin, erhalten durch die den dynamischen Bereich abschätzende Einrichtung (10101), und gibt die codierten Daten aus.
  • Wie vorstehend beschrieben ist, wird, in der vorliegenden Ausführungsform, unter Verwendung der Eigenschaft eines Mehrfach-Wert-Bilds, dass nahezu alle Pixel in dem Bild einen gleichförmigen minimalen Wert oder maximalen Wert mit Zwischenwerten, verteilt entlang der Grenze, haben, der Zustand der Verteilung der Zwischenwerte analysiert, die Glättungsfunktion, die eine gute Annäherung der Zwischenwertverteilung liefert, wird abgeschätzt, und ein Binär-Basis-Bild entsprechend zu der abgeschätzten Glättungsfunktion wird abgeschätzt. Durch individuelles Codieren des abgeschätzten, maximalen Pixel-Werts und des minimalen Pixel-Werts, der abgeschätzten Glättungsfunktion und des abgeschätzten, binären Basis-Bilds, und durch Ausgeben der Ergebnisse als codierte Daten, kann eine effiziente Codierung erreicht werden.
  • (Ausführungsform B2)
  • 45 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer B2. Ausführungsform darstellt, die für das Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist eine Binär-Bild-Decodiereinrichtung (10901) eine Einrichtung zum Zurückgewinnen des binären Bilds durch Decodieren der Binär-Bild-codierten Daten. Die die Glättungsfunktion decodierende Einrichtung (10902) ist eine Einrichtung zum Zurückgewinnen der Glättungsfunktion durch Decodieren der durch die Glättungsfunktion codierten Daten.
  • Die einen dynamischen Bereich decodierende Einrichtung (10903) ist eine Einrichtung zum Zurückgewinnen des dynamischen Bereichs durch Decodieren der den dynamischen Bereich codierten Daten.
  • Die Binär-zu-Mehrfach-Wert-Konvertiereinrichtung (10904) ist eine Einrichtung zum Zurückgewinnen des Mehrfach-Wert-Bilds durch Glättung des binären Bilds unter Verwendung der Glättungsfunktion, zurückgewonnen durch die die Glättungsfunktion decodierende Einrichtung (10902), und unter Durchführen einer Luminanz-Konversion unter Verwendung des dynamischen Bereichs, zurückgewonnen durch die den dynamischen Bereich decodierende Einrichtung (10903).
  • Die Binär-Masken-Anwendungseinrichtung (10905) ist eine Einrichtung zum Erhalten eines neuen Mehrfach-Wert-Bilds durch Anwenden einer Maskierung auf das Mehrfach-Wert-Bild mit dem binären Bild durch die Binär-Bild-Decodiereinrichtung (10901) zurückgewonnen.
  • Die Betriebsweise der so konfigurierten Bild-Decodiereinichtung der vorliegenden Ausführungsform wird nachfolgend beschrieben werden.
  • Die Binär-Bild-Decodiereinrichtung (10901) gewinnt das binäre Bild zurück, das nur zwei Pixel-Werte, 0 und 255, besitzt, durch Decodieren der codierten Daten für das binäre Bild, die unter Verwendung des Codier-Schemas MMR für das binäre Bild, definiert in CCITT's International Standard, traditionell verwendet für Facsimile-Systeme, usw., codiert wurden.
  • Die Glättungsfunktion-Decodiereinrichtung (10902) gewinnt die Glättungsfunktion durch Decodieren der codierten Daten mittels der Glättungsfunktion zurück.
  • Die den dynamischen Bereich decodierende Einrichtung (10903) gewinnt den maximalen Pixel-Wert Dmax und den minimalen Pixel-Wert Dmin durch Decodieren der in Bezug auf den den dynamischen Bereich codierten Daten zurück.
  • Die Binär-zu-Mehrfach-Wert-Konvertiereinrichtung (10904) wendet tatsächlich den Glättungfilter, zurückgewonnen durch die Glättungsfunktion-Decodiereinrichtung (10902), an. (Für das Verfahren eines Anwendens des Glättungsfilters wird auf die Beschreibung der Glättungsfunktion-Auswahleinrichtung (10307) und 42 Bezug genommen.) Weiterhin wird, unter Verwendung des maximalen Pixel-Werts Dmax und des minimalen Pixel-Werts Dmin, zurückgewonnen durch die den dynamischen Bereich decodierende Einrichtung (10903), eine lineare Konversion durchgeführt, wie in 46 darge stellt ist, um das Mehrfach-Wert-Bild zurückzugewinnen. In der Binär-Masken-Anwendungseinrichtung (10905) werden, unter Verwendung des binären Bilds, zurückgewonnen durch die Binär-Bild-Decodiereinrichtung (10901), die Werte der Pixel in dem Mehrfach-Wert-Bild, das den Pixeln von Wert 0 in dem binären Bild entspricht, zwangsläufig zu Dmin geändert, so dass die Pixel in dem codierten Mehrfach-Wert-Bild, die einen minimalen Pixel-Wert haben, nicht irgendeinen anderen Wert als den minimalen Pixel-Wert annehmen. Die Binär-Masken-Anwendungseinrichtung (10905) ist effektiv insbesondere dann, wenn dort ein Erfordernis vorhanden ist, um die Position von Dmin zu beschränken, um eine Anpassung mit Textur-Daten beizubehalten, kann allerdings weggelassen werden, wenn dort kein solches Erfordernis vorhanden ist.
  • Wie vorstehend beschrieben ist, wird, in der vorliegenden Ausführungsform, durch Verwenden der Eigenschaften eines Mehrfach-Wert-Bilds, dass alle Pixel in dem Bild einen gleichförmigen, minimalen Wert oder einen maximalen Wert mit Zwischenwerten, verteilt entlang der Grenze, haben, der Zustand der Verteilung der Zwischenwerte analysiert, die Glättungsfunktion, die eine gute Annäherung der Zwischenwertverteilung liefert, wird abgeschätzt, und ein binäres Basis-Bild, entsprechend zu der abgeschätzten Glättungsfunktion, wird abgeschätzt. Durch individuelles Codieren und Ausgeben des abgeschätzten, maximalen Pixel-Werts und des minimalen Pixel-Werts, der abgeschätzten Glättungsfunktion und des abgeschätzten, binären Basis-Bilds, und durch Decodieren der codierten Daten, die so ausgegeben sind, kann eine effiziente Decodierung mit weniger Code-Bits erreicht werden.
  • (Ausführungsform B3)
  • 47 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer B3. Ausführungsform der vorliegenden Erfindung darstellt. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist eine einen dynamischen Bereich abschätzende Einrichtung (11101) eine Einrichtung, die ein Ziel-Mehrfach-Wert-Bild als eine Eingabe aufnimmt, und die den Pixel-Wert des größten Bereichs und den Pixel-Wert des zweitgrößten Bereichs in dem Mehrfach-Wert-Bild extrahiert.
  • Eine eine Glättungsfunktion abschätzende Einrichtung (11102) ist eine Einrichtung, die ein Mehrfach-Wert-Bild und einen dynamischen Bereich als Eingaben aufnimmt und die eine Glättungsfunktion durch Analysieren von Luminanz-Gradienten in dem Mehrfach-Wert-Bild abschätzt.
  • Eine Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (11103) ist eine Einrichtung, die ein binäres Bild unter Verwendung des dynamischen Bereichs, der Glättungsfunktion und des Mehrfach-Wert-Bilds erzeugt, so dass das Mehrfach-Wert-Bild gut angenähert werden kann, wenn eine Luminanz-Konversion unter Verwendung des dynamischen Bereichs vorgenommen wird und die Glättung unter Verwendung der Glättungsfunktion durchgeführt wird.
  • Die Dynamik-Bereich-Codiereinrichtung (11105) ist eine Einrichtung, die den dynamischen Bereich codiert und die die codierten Daten ausgibt.
  • Die Glättungsfunktion-Codiereinrichtung (11106) ist eine Einrichtung, die die Glättungsfunktion codiert und die decodierten Daten ausgibt.
  • Eine Binär-Bild-Codiereinrichtung (11104) ist eine Einrichtung, die das binäre Bild codiert und die codierten Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Ausführungsform wird nachfolgend beschrieben werden.
  • Die den dynamischen Bereich abschätzende Einrichtung (11101) extrahiert den Pixel-Wert des größten Pixel-Bereichs und den Pixel-Wert des zweitgrößten Bereichs in dem Mehrfach-Wert-Bild; in vielen Mehrfach-Wert-Bildern stimmen diese Pixel-Werte mit dem größten Pixel-Wert und dem kleinsten Pixel-Wert jeweils überein, so dass, in der vorliegenden Ausführungsform, der größte Pixel-Wert Dmax und der kleinste Pixel-Wert Dmin durch Abtasten des Ziel-Mehrfach-Wert-Bilds extrahiert werden.
  • Die Glättungsfunktion-Abschätzeinrichtung (11102) ist in 48 dargestellt.
  • In einer x-Richtung-Filterung (11201) wird ein x-Richtung-Filter (10401) angewandt und über das Bild abgetastet, um den Gradienten entlang der x-Richtung in dem Bild zu erfassen. In einer y-Richtung-Filterung (11202) wird ein y-Richtung-Filter (10402) angewandt und über das Bild abgetastet, um den Gradienten entlang der y-Richtung in dem Bild zu erfassen.
  • Bei einer Gradienten-Erfassung (11203) wird ein Gradient d (i, j) durch Berechnen von Gleichung B1 unter Verwendung des x-Richtung-Gradienten dx (i, j), erhalten durch die x-Richtung-Filterung (11201), und den y-Richtung-Gradienten dy (i, j), erhalten durch die y-Richtung-Filterung (11202), erfasst, wobei (i, j) die Koordinaten auf dem Bild sind.
  • Bei der Gradienten-Richtung-Erfassung (11204) wird eine Gradienten-Richtung Θ (i, j) durch Berechnung von Gleichung B2 unter Verwendung des x-Richtung-Gradienten dx (i, j), erhalten durch die x-Richtung-Filterung (11201), und den y-Richtung-Gradienten dy (i, j), erhalten durch die y-Richtung-Filterung (11202), erfasst, wobei (i, j) die Koordinaten auf dem Bild sind.
  • Bei der Nicht-Maximum-Wert-Unterdrückung (11205), unter Verwendung eines Fensters, das sich mit Θ ändert, wie in 40 dargestellt ist, wird ein Bild in einer solchen Art und Weise erzeugt, dass dann, wenn der Wert des Gradienten an einem Referenz-Punkt innerhalb des Fensters ein Mnimal-Wert ist, der Bildbereich an den Koordinaten des Referenz-Punkts einem Wert von 1 zugeordnet wird; ansonsten wird der Bildbereich an den Koordinaten des Referenz-Punkts einem Wert von 0 zugeordnet.
  • Bei einer Durchschnitt-Gradienten-Erfassung (11206) wird ein Durchschnitsgradient d'ave durch Berechnen des Durchschnitts der Gradienten, erfasst in der Gradienten-Erfassung (11203) für die Pixel des Werts 1 in dem binären Bild, erhalten durch die Nicht-Maximum-Wert-Unterdrückung (11205), erhalten. Weiterhin wird, unter Verwendung des Maximum-Pixel-Werts Dmax und des Minimum-Pixel-Werts Dmin, erfasst durch die den dynamischen Bereich abschätzende Einrichtung (11101), ein normierter Durchschnitt-Gradient erneut aus Gleichung B3 nachfolgend berechnet, um daue zu erhalten.
  • In der Glättungsfunktion-Konstruktion (11207) wird ein Glättungsfilter entsprechend dem normierten, durchschnittlichen Gradienten daue konstruiert, wie in 49 dargestellt ist. Die Zahl von Schritten des konstruierten Glättungsfilters wird entsprechend dem Gradienten variiert, wie in 49 dargestellt ist. Das Detail des Glättungsfilters von 49 ist in 50 dargestellt. In der Figur werden die Glättungsfilterstufe 2, die Glättungsfilterstufe 3 und die Glättungsfilterstufe 4 mit 11401, 11402 und 11403 jeweils bezeichnet. Die Glättungsfilter-Koeffizienten-Tabelle 11404 ist auch in der Figur dargestellt. Wenn daue größer als 191 ist, wird eine Glättung durch den Glättungsfilter nicht angewandt werden, da der Gradient des Bilds dahingehend angesehen wird, eine Stufenkante darzustellen. Andererseits wird, wenn daue kleiner als 10 ist, eine Glättung durch den Glättungsfilter nicht angewandt werden, da davon ausgegangen wird, dass dort kein Bild-Gradient vorhanden ist.
  • Die Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (11103) wandelt das Mehrfach-Wert-Bild zu einem binären Bild um, das nur zwei Pixel-Werte 255 und 0, besitzt, durch Berücksichtigen der Charakteristik der Glättungsfunktion, abgeschätzt durch die Glättungsfunktion-Abschätzeinrichtung (11102). Die Ansprechverhalten auf eindimensionale Stufen der Glättungsfilter-Stufe 2, der Glättungsfilter-Stufe 3 und der Glättungsfilter-Stufe 4 sind in 51 dargestellt; dementsprechend schließt die Mehrfach-Wert-zu-Binär-Konversion entsprechend zu der Glättungsfilter-Stufe 2 (11401), der Glättungsfilter-Stufe 3 (11402) und der Glättungsfilter-Stufe 4 (11403) die Schwellwertbildung ein, dargestellt in 44, gefolgt durch eine morphologische Verarbeitung mit einem morphologischen Filter, wie beispielsweise einem solchen, der in 52 dargestellt ist. Das bedeutet, dass die Verarbeitung so ist, dass dann, wenn die Glättungsfilter-Stufe 2 konstruiert wird, der Referenz-Punkt durch den kleinsten Wert innerhalb des Filterfensters unter Verwendung des morphologischen Filters 1 (11601) ersetzt wird; wenn die Glättungsfilter-Stufe 3 (11603) konstruiert wird, wird der Referenz-Punkt durch den kleinsten Wert innerhalb des Filterfensters durch Verwendung des morphologischen Filters 2 (11602) ersetzt; und wenn die Glättungsfilter-Stufe 4 konstruiert wird, wird der Referenz-Punkt durch den kleinsten Wert innerhalb des Filterfensters durch Verwendung des morphologischen Filters 3 ersetzt.
  • Deshalb wendet die Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (11103) die morphologische Verarbeitung auf das Mehrfach-Wert-Bild durch Verwendung des Glättungsfilters, konstruiert so, wie dies in 52 dargestellt ist, nach Durchführen der Schwellwertbildung, dargestellt in 44, an.
  • Die das binäre Bild codierende Einrichtung (11104) codiert das binäre Bild unter Verwendung des Binär-Bild-Codierschemas MMR, definiert in CCITT's International Standard, traditionell verwendet für Facsimile-Systeme, usw., und gibt die codierten Daten aus.
  • Die Glättungsfunktion-Codiereinrichtung (11106) codiert die Glättungsfunktion, abgeschätzt durch die Glättungsfunktion-Abschätzeinrichtung (11102), und gibt die codierten Daten aus.
  • Die den dynamischen Bereich codierende Einrichtung (11105) codiert das Dmax und Dmin, erhalten durch die den dynamischen Bereich abschätzende Einrichtung (11101), und gibt die codierten Daten aus.
  • Wie vorstehend beschrieben ist, wird, in der vorliegenden Ausführungsform, unter Verwendung der Eigenschaft eines Mehrfach-Wert-Bilds, dass nahezu alle Pixel in dem Bild einen gleichförmigen, minimialen Wert oder maximalen Wert mit Zwischenwerten, verteilt entlang der Grenze, haben, der Zustand der Verteilung der Zwischenwerte analysiert, die Glättungsfunktion, die eine gute Annäherung der Zwischenwertverteilung liefert, wird abgeschätzt, und ein Binär-Basis-Bild entsprechend zu der abgeschätzten Glättungsfunktion wird abgeschätzt. Durch individuelles Codieren des abgeschätzten, maximalen Pixel-Werts und des minimalen Pixel-Werts, der abgeschätzten Glättungsfunktion und des abgeschätzten Binär-Basis-Bilds und Ausgeben der Ergebnisse als codierte Daten, kann eine effiziente Codierung erreicht werden.
  • (Ausführungsform B4)
  • 53 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer B4. Ausführungsform darstellt, die für das Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist die Binär-Bild-Decodiereinrichtung (11701) eine Einrichtung zum Zurückgewinnen des binären Bilds durch Decodieren der codierten Daten des binären Bilds. Die Glättungsfunktion-Decodiereinrichtung (11702) ist eine Einrichtung zum Zurückgewinnen der Glättungsfunktion durch Decodieren der codierten Daten der Glättungsfunktion.
  • Die den dynamischen Bereich decodierende Einrichtung (11703) ist eine Einrichtung zum Zurückgewinnen des dynamischen Bereichs durch Decodieren der Daten in Bezug auf den dynamischen Bereich.
  • Eine Binär-zu-Mehrfach-Wert-Konvertiereinrichtung (11704) ist eine Einrichtung zum Zurückgewinnen des Mehrfach-Wert-Bilds durch Glätten des binären Bilds unter Verwendung der Glättungsfunktion, zurückgewonnen durch die Glättungsfunktion-Decodiereinrichtung (11702), und unter Durchführen einer Luminanz-Konversion unter Verwendung des dynamischen Bereichs, zurückgewonnen durch die den dynamischen Bereich decodierende Einrichtung (11703).
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Ausführungsform wird nachfolgend beschrieben werden.
  • Die das binäre Bild decodierende Einrichtung (11701) gewinnt das binäre Bild zurück, das nur zwei Pixel-Werte, 0 und 255, besitzt, durch Decodieren der in Bezug auf das binäre Bild codierten Daten, die unter Verwendung des Binär-Bild-Codier-Schemas MMR, definiert in CCITT's International Standard, traditionell verwendet für Facsimile-Systeme, usw., codiert wurden.
  • Die Glättungsfunktion-Decodiereinrichtung (11702) gewinnt die Glättungsfunktion durch Decodieren der in Bezug auf die Glättungsfunktion codierten Daten zurück.
  • Die den dynamischen Bereich decodierende Einrichtung (11703) gewinnt den maximalen Pixel-Wert Dmax und den minimalen Pixel-Wert Dmin durch Decodieren der codierten Daten des dynamischen Bereichs zurück. Die Binär-zu-Mehrfach-Wert-Konvertiereinrichtung (11704) wendet tatsächlich den Glättungsfilter, zurückgewonnen durch die Glättungsfunktion-Decodiereinrichtung (11702), an. (Für das Verfahren einer Anwendung des Glättungsfilters wird Bezug auf die Beschreibung der Glättungsfunktion-Konstruiereinrichtung (11207) und 50 genommen.) Weiterhin wird, unter Verwendung des maximalen Pixel-Werts Dmax und des minimalen Pixel-Werts Dmin, zurückgewonnen durch die den dynamischen Bereich decodierende Einrichtung (10903), eine lineare Konversion durchgeführt, wie in 46 dargestellt ist, um das Mehrfach-Wert-Bild zurückzugewinnen.
  • Wie vorstehend beschrieben ist, wird, bei der vorliegenden Ausführungsform, unter Verwendung der Eigenschaft eines Mehrfach-Wert-Bilds, dass nahezu alle Pixel in dem Bild einen gleichförmigen, maximalen Wert oder minimalen Wert mit Zwischenwerten, verteilt entlang der Grenze, haben, der Zustand der Verteilung der Zwischenwerte analysiert, die Glättungsfunktion, die eine gute Annäherung der Zwischenwertverteilung liefert, wird abgeschätzt, und ein Binär-Basis-Bild entsprechend zu der abgeschätzten Glättungsfunktion wird abgeschätzt. Durch individuelles Codieren und Ausgeben des abgeschätzten, maximalen Pixel-Werts und des minimalen Pixel-Werts, der abgeschätzten Glättungsfunktion und des abgeschätzten Binär-Basis-Bilds und durch Decodieren der codierten Daten, die so ausgegeben sind, kann eine effiziente Decodierung mit weniger Code-Bits erreicht werden.
  • (Ausführungsform B5)
  • 54 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer B5. Ausführungsform darstellt, die für das Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist eine einen dynamischen Bereich abschätzende Einrichtung (11801) eine Einrichtung, die ein Ziel-Mehrfach-Wert-Bild als eine Eingabe aufnimmt und die den Pixel-Wert des größten Bereichs und den Pixel-Wert des zweitgrößten Bereichs in dem Mehrfach-Wert-Bild extrahiert.
  • Eine eine Glättungsfunktion abschätzende Einrichtung (11802) ist eine Einrichtung, die das Mehrfach-Wert-Bild und einen dynamischen Bereich als Eingaben aufnimmt und die eine Glättungsfunktion durch Analysieren von Luminanz-Gradienten in dem Mehrfach-Wert-Bild abschätzt. Eine Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (11803) ist eine Einrichtung, die ein binäres Bild unter Verwendung des dynamischen Bereichs, der Glättungsfunktion und des Mehrfach-Wert-Bilds erzeugt, so dass das Mehrfach-Wert-Bild gut angenähert werden kann, wenn eine Luminanz-Konversion unter Verwendung des dynamischen Bereichs durchgeführt wird und die Glättung unter Verwendung der Glättungsfunktion vorgenommen wird.
  • Die den dynamischen Bereich codierende Einrichtung (11805) ist eine Einrichtung, die den dynamischen Bereich codiert und die codierten Daten ausgibt.
  • Die Glättungsfunktion-Koeffizienten-Codiereinrichtung (11806) ist eine Einrichtung, die die Glättungsfunktion codiert und die codierten Daten ausgibt. Die Binär-Bild-Codiereinrichtung (11804) ist eine Einrichtung, die das binäre Bild codiert und die codierten Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Ausführungsform wird nachfolgend beschrieben werden.
  • Die den dynamischen Bereich abschätzende Einrichtung (11801) extrahiert den Pixel-Wert des größten Bereichs und den Pixel-Wert des zweitgrößten Bereichs in dem Mehrfach-Wert-Bild; in vielen Mehrfach-Wert-Bildern stimmen diese Pixel-Werte mit dem größten Pixel-Wert und dem kleinsten Pixel-Wert jeweils überein, so dass, in der vorliegenden Ausführungsform, der größte Pixel-Wert Dmax und der kleinste Pixel-Wert Dmin durch Abtasten des Ziel-Mehrfach-Wert-Bilds extrahiert werden.
  • Die die Glättungsfunktion abschätzende Einrichtung (11802) ist in 55 dargestellt.
  • In einer x-Richtung-Filterung (11901) wird ein x-Richtung-Filter (10401) angewandt und über das Bild abgetastet, um den Gradienten entlang der x-Richtung in dem Bild zu erfassen.
  • In einer y-Richtung-Filterung (11902) wird ein y-Richtung-Filter (10402) angewandt und über das Bild abgetastet, um den Gradienten entlang der y-Richtung in dem Bild zu erfassen. Bei einer Gradienten-Erfassung (11903) wird ein Gradient d (i, j) durch Berechnen von Gleichung B1 unter Verwendung des x-Richtung-Gradienten dx (i, j), erhalten durch die y-Richtung-Filterung (11901), und des y-Richtung-Gradienten dy (i, j), erhalten durch die x-Richtung-Filterung (11902), erfasst, wobei (i, j) die Koordinaten auf dem Bild sind.
  • Bei der Gradienten-Richtung-Erfassung (11904) wird eine Gradienten-Richtung θ (i, j) durch Berechnung von Gleichung B2 unter Verwendung des x-Richtung-Gradienten dx (i, j), erhalten durch die x-Richtung-Filterung (11901), und den y-Richtung-Gradienten dy (i, j), erhalten durch die y-Richtung-Filterung (11902), erfasst, wobei (i, j) die Koordinaten auf dem Bild sind. In der Nicht-Maximum-Wert-Unterdrückung (11905), unter Verwendung eines Fensters, das sich mit Θ ändert, wie in 40 dargestellt ist, wird ein Bild in einer solchen Art und Weise erzeugt, dass dann, wenn der Wert des Gradienten an dem Referenz-Punkt innerhalb des Fensters ein maximaler Wert ist, der Bildbereich an den Koordinaten des Referenz-Punkts einem Wert von 1 zugeordnet wird; ansonsten wird der Bildbereich an den Koordinaten des Referenz-Punkts einem Wert von 0 zugeordnet.
  • In einer Richtung-für-Richtung-Durchschnitt-Gradienten-Erfassung (11906) wird ein durchschnittlicher Gradient für jede der zwei Richtungen erhalten, d. h. die horizontale und vertikale Richtung, basierend auf der Gradienten-Richtung, erfasst in der Gradienten-Erfassung (11904), durch Berechnen des Durchschnitts der Gradienten, erfasst in der Gradienten-Erfassung (11903) für die Pixel des Werts 1 in dem binären Bild, erhalten durch die Nicht-Maximum-Wert-Unterdrückung (11905). Weiterhin wird, unter Verwendung des maximalen Pixel-Werts Dmax und des minimalen Pixel-Werts Dmin, erfasst durch die den dynamischen Bereich abschätzende Einrichtung (11901), ein normierter Durchschnitt-Gradient erneut aus Gleichung B3 berechnet, um den durchschnittlichen Gradienten, dave_1, in der vertikalen Richtung, und den durchschnittlichen Gradienten, daue 2, in der horizontalen Richtung zu erhalten.
  • Bei der Glättungsfunktion-Erzeugung (11907) wird ein Glättungsfilter durch Abschätzen von Glättungsfilter-Koeffizienten basierend auf den durchschnittlichen Gradienten dave_1 und daue 2, erzeugt. In der vorliegenden Ausführungsform werden die Koeffizienten des Glättungsfilters von Stufe Nummer 3, dargestellt in 56, abgeschätzt.
  • Hierbei werden Einschränkungen durch Gleichung 4 auferlegt, allerdings kann, in Abhängigkeit von dem Bild, jeder Koeffizient gewichtet werden.
  • (Gleichung B4)
    • a = 1 (4)
    • b = f,c = h (5)
    • Figure 00570001
    • j = a + b + c + d + e + f + g + h + i (7)
  • Unter Verwendung von dave_1 wird c durch Gleichung B5 abgeschätzt. Allerdings wird, wenn dave_1 größer als 200 ist, der Gradient des Bilds dahingehend angesehen, eine Stufenkante darzustellen, so dass c auf 0 eingestellt wird. Andererseits wird, wenn dave_1 kleiner als 50 ist, davon ausgegangen, dass dort kein Bild-Gradient vorhanden ist, so dass c auf 0 gesetzt wird.
  • Figure 00570002
  • Unter Verwendung von daue 2 wird b durch Gleichung B6 abgeschätzt. Allerdings wird, wenn daue 2 größer als 200 ist, der Gradient des Bilds dahingehend angesehen, eine Stufenkante darzustellen, so dass b auf 0 eingestellt wird. Andererseits wird, wenn daue 2 kleiner als 50 ist, davon ausgegangen, dass dort kein Bild-Gradient vorhanden ist, so dass b auf 0 gesetzt wird.
  • Figure 00570003
  • Filter-Koeffzienten und Skalen werden unter Verwendung der Gleichungen B4, B5 und B6 abgeschätzt, wie vorstehend beschrieben ist. Die Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (11903) wandelt das Mehrfach-Wert-Bild in ein binäres Bild um, das nur zwei Pixel-Werte, 255 und 0, besitzt, unter Berücksichtigung der Charakteristik der Glättungsfunktion, abgeschätzt durch die die Glättungsfunktion abschätzende Einrichtung (11902). In dieser Ausführungsform wird der Schwellwert, basierend auf dem Filter-Koeffizienten, abgeschätzt und das binäre Bild wird durch Schwellwertbildung des Mehr fach-Wert-Bilds unter Verwendung des abgeschätzten Schwellwerts erhalten. Der Schwellwert y wird durch Gleichung B7 abgeschätzt.
  • Figure 00580001
  • Die das binäre Bild codierende Einrichtung (11804) codiert das binäre Bild unter Verwendung des Binär-Bild-Codier-Schemas MMR, definiert in CCITT's International Standard, traditionell verwendet für Facsimile-Systeme, usw., und gibt die codierten Daten aus.
  • Die Glättungsfunktion-Koeffizienten-Codiereinrichtung (11806) codiert jeden Koeffizienten und jede Skala der Glättungsfunktion, abgeschätzt durch die die Glättungsfunktion abschätzende Einrichtung (11802), und gibt die codierten Daten aus. Die den dynamischen Bereich codierende Einrichtung (11805) codiert individuell das Dmax und Dmin, erhalten durch die den dynamischen Bereich abschätzende Einrichtung (11801), und gibt die codierten Daten aus.
  • Wie vorstehend beschrieben ist, wird, in der vorliegenden Ausführungsform, unter Verwendung der Eigenschaft eines Mehrfach-Wert-Bilds, dass nahezu alle Pixel in dem Bild einen gleichförmigen, maximalen Wert oder minimalen Wert mit Zwischenwerten, verteilt entlang der Grenze, haben, der Zustand der Verteilung der Zwischenwerte analysiert, die Glättungsfunktion, die eine gute Annäherung der Zwischenwertverteilung liefert, wird abgeschätzt, und ein Binär-Basis-Bild entsprechend zu der abgeschätzten Glättungsfunktion wird abgeschätzt. Durch individuelles Codieren des abgeschätzten, maximalen Pixel-Werts und des minimalen Pixel-Werts, der abgeschätzten Glättungsfunktion und des abgeschätzten Binär-Basis-Bilds und Ausgeben der Ergebnisse als codierte Daten, kann eine effiziente Codierung erreicht werden.
  • (Ausführungsform B6)
  • 57 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer B6. Ausführungsform darstellt, die für das Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist die Binär-Bild-Decodiereinrichtung (12101) eine Einrichtung zum Zurückgewinnen des binären Bilds durch Decodieren der codierten Daten des binären Bilds.
  • Die Glättungsfunktion-Decodiereinrichtung (12102) ist eine Einrichtung zum Zurückgewinnen der Glättungsfunktion durch Decodieren der codierten Daten der Glättungsfunktion.
  • Die den dynamischen Bereich decodierende Einrichtung (12103) ist eine Einrichtung zum Zurückgewinnen des dynamischen Bereichs durch Decodieren der codierten Daten des dynamischen Bereichs.
  • Eine Binär-zu-Mehrfach-Wert-Konvertiereinrichtung (12104) ist eine Einrichtung zum Zurückgewinnen des Mehrfach-Wert-Bilds durch Glätten des binären Bilds unter Verwendung der Glättungsfunktion, zurückgewonnen durch die Glättungsfunktion-Decodiereinrichtung (12102), und unter Durchführen einer Luminanz-Konversion unter Verwendung des dynamischen Bereichs, zurückgewonnen durch die den dynamischen Bereich decodierende Einrichtung (12103).
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Ausführungsform wird nachfolgend beschrieben werden.
  • Die das binäre Bild decodierende Einrichtung (12101) gewinnt das binäre Bild zurück, das nur zwei Pixel-Werte, 0 und 255, besitzt, durch Decodieren der codierten Daten des binären Bilds, die unter Verwendung des Binär-Bild-Codier-Schemas MMR, definiert in CCITT's International Standard, traditionell verwendet für Facsimile-Systeme, usw., codiert wurden.
  • Die Glättungsfunktion-Koeffizienten-Decodiereinrichtung (12102) gewinnt die Glättungsfilter-Koeffizienten und Skalen zurück und demzufolge die Glättungsfunktion durch Decodieren der codierten Daten der Glättungsfunktion. Die den dynamischen Bereich decodierende Einrichtung (12103) gewinnt den maximalen Pixel-Wert Dmax und den minimalen Pixel-Wert Dmin durch Decodieren der codierten Daten des dynamischen Bereichs zurück. Die Binär-zu-Mehrfach-Wert-Konvertiereinrichtung (12104) wendet eine Konvolution mit dem Glättungsfilter, zurückgewonnen durch die Glättungsfunktion-Koeffizienten-Decodiereinrichtung (12102), an. Weiterhin wird, unter Verwendung des maximalen Pixel- Werts Dmax und des minimalen Pixel-Werts Dmin, zurückgewonnen durch die den dynamischen Bereich decodierende Einrichtung (12103), eine lineare Konversion durchgeführt, wie in 46 dargestellt ist, um das Mehrfach-Wert-Bild zurückzugewinnen.
  • Wie vorstehend beschrieben ist, wird, bei der vorliegenden Ausführungsform, unter Verwendung der Eigenschaft eines Mehrfach-Wert-Bilds, dass nahezu alle Pixel in dem Bild einen gleichförmigen, maximalen Wert oder minimalen Wert mit Zwischenwerten, verteilt entlang der Grenze, haben, der Zustand der Verteilung der Zwischenwerte analysiert, die Glättungsfunktion, die eine gute Annäherung der Zwischenwertverteilung liefert, wird abgeschätzt, und ein Binär-Basis-Bild entsprechend zu der abgeschätzten Glättungsfunktion wird abgeschätzt. Durch individuelles Codieren und Ausgeben des abgeschätzten, maximalen Pixel-Werts und des minimalen Pixel-Werts, der abgeschätzten Glättungsfunktion und des abgeschätzten Binär-Basis-Bilds und durch Decodieren der codierten Daten, die so ausgegeben sind, kann eine effiziente Decodierung mit weniger Code-Bits erreicht werden.
  • (Ausführungsform B7)
  • 58 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer B7. Ausführungsform darstellt, die für das Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist eine Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (12201) eine Einrichtung, die ein Ziel-Bild (mit einem Bereich von Werfen von 0 bis 255, wobei jede eine ganze Zahl ist) als eine Eingabe aufnimmt und die das Eingabe-Ziel-Bild durch Zuordnen eines Werts von 0 zu Pixeln eines Werts von 0 und eines Werts von 255 zu Pixeln anderer Werten binärisiert.
  • Die Binär-Bild-Codiereinrichtung (12202) ist eine Einrichtung, die das binäre Bild, das Werte von {0, 255} besitzt, codiert und die codierten Daten ausgibt. Die eine Glättungsfunktion abschätzende Einrichtung (12203) ist eine Einrichtung zum Bestimmen einer Glättungsfunktion. Die Glättungsfunktion-Codiereinrichtung (12204) ist eine Einrichtung zum Codieren der so bestimmten Funktion. Hier entspricht die Glättungsfunktion-Abschätzeinrichtung (12203) der Glättungsfunktion-Erzeugungseinrichtung der vorliegenden Erfindung.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Ausführungsform wird nachfolgend beschrieben werden.
  • Das binäre Bild, binärisiert durch die Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (12201), wird durch die Binär-Bild-Codiereinrichtung (12202) codiert. Für das Codieren wird das Binär-Bild-Codier-Schema MMR, definiert in CCITT's International Standard, verwendet, mit einem Wert 0 als weiß und 255 als schwarz.
  • Andererseits wird das binärisierte Bild durch die Glättungsfunktion-Abschätzeinrichtung (12203) mit dem Eingabe-Mehrtach-Wert-Bild verglichen, um die Glättungsfunktion zu bestimmen. Dies wird nachfolgend unter Bezugnahme auf die 60 und 61 erläutert werden.
  • Wie in der Beschreibung zum Stand der Technik angeführt ist, haben viele Alpha-Ebenen die Eigenschaft, dass die meisten Bereiche gleichförmig sind und Zwischenwerte entlang der Grenze verteilt sind. Um die Zwischenwerte, verteilt entlang der Grenze, zu reproduzieren, wird die Glättungsoperationen berücksichtigt, wo eine Substitution für den Mitten-Pixel-Wert, in Abhängigkeit davon, ob die Werte der vertikal (b3, b0) und der horizontal (b2, b1) benachbarten Pixel 255 sind oder nicht, vorgenommen.
  • Da das Ziel-Mehrfach-Wert-Bild durch Zuordnen von 0 zu Pixeln des Werts 0 und 255 zu Pixeln anderer Werte binärisiert ist, wird die Substitution nur dann durchgeführt, wenn der Wert des Ziel-Pixels 255 ist. Deshalb wird das Binärisierungsmuster der vier Nachbarn eines Pixels, unter Heranziehen des Werts von 255, durch vier Bits (16 Muster) ausgedrückt.
  • Die Glättungsfunktion-Abschätzeinrichtung (12203) tastet das Bild ab und erhält den Wert, um durch Auffinden des Durchschnittswerts für jedes der 16 Muster der vier benachbarten Pixel eines Pixels, das den Wert von 255 nimmt, zu substituieren. Ein Beispiel ist in Tabelle 1 dargestellt.
  • (Tabelle 1)
    Figure 00620001
  • Demgemäß wird, in dem Fall eines Pixels an der Grenze, wo sich der Wert von 0 zu 255 ändert, wie in der ersten Stufe einer Glättung in 61, zum Beispiel, dargestellt ist, 128 für den Pixel-Wert substituiert. Falls dort zwei oder mehr Pixel mit Zwischenwerten an oder nahe der Kontur vorhanden sind, wird der Vorgang zum Auffinden des Durchschnittswerts für jedes der 16 Muster der vier benachbarten Pixel in einer rekursiven Art und Weise für die Pixel wiederholt, die den Wert von 255 haben. Tabelle 2 stellt die Er gebnisse dieser zweiten Operation dar. Auf diese Art und Weise kann eine Grenze, die einen Zwischenwert besitzt, entsprechend der zweiten Stufe der Glättung in 61, ausgedrückt werden.
  • (Tabelle 2)
    Figure 00630001
  • Der Ausgabe der Glättungsfunktion-Abschätzeinrichtung (12203) wird als die Zahl von Stufen einer Glättung (in dem dargestellten Beispiel, 2 Stufen, wobei die maximale, mögliche Zahl 8 Stufen ist) und von Pixel-Wert-Tabellen für die Muster von (b3, b2, b1, b0) entsprechend zu der Zahl von Stufen erhalten. Hierbei bezieht sich die Zahl von Stufen auf die Zahl von Wiederholungen des Glättungsvorgangs, der in einer rekursiven Art und Weise wiederholt wird. Die Glättungsfunktion-Codiereinrichtung (12204) codiert die Zahl von Stufen einer Glättung als drei Bits und die Pixel-Wert-Tabellen für die Muster von (b3, b2, b1, b0) als 8 Bits × 15 (die Zahl von Mustern, ausschließlich des Musters, in dem alle Pixel-Werte 255 sind) × Zahl der Stufen.
  • (Ausführungsform B8)
  • 59 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer B8. Ausführungsform darstellt, die für das Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden. Ausgänge von der Bild-Codiervorrichtung der siebten Ausführungsform werden als Eingänge zu der Decodiervorrichtung der vorliegenden Erfindung zugeführt. Eine Binär-Bild-Decodiereinrichtung (12301) ist eine Einrichtung, die die Ausgabe der Binär-Bild-Codiereinrichtung (12201) als eine Eingabe heranzieht und das binäre Bild von {0, 255} von den codierten Daten des Binär-Bilds zurückgewinnt. Eine Glättungsfunktion-Decodiereinrichtung (12302) ist eine Decodiereinrichtung zum Decodieren des Ausgangs der Glättungsfunktion-Codiereinrichtung (12204). Eine Binär-zu-Mehrfach-Wert-Konvertiereinrichtung (12303) ist eine Einrichtung, die die Glättungsfunktion und das binäre Bild als Eingaben heranzieht und das Mehrfach-Wert-Bild rekonstruiert.
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Ausführungsform wird nachfolgend beschrieben werden.
  • Die das binäre Bild decodierende Einrichtung (12301) verwendet das MMR-Decodier-Schema. Die Glättungsfunktion-Decodiereinrichtung decodiert die Anzahl von Stufen einer Glättung und die Substitution-Pixel-Wert-Tabellen für die Muster entsprechend zu der Anzahl von Stufen. Die decodierten Tabellen werden dahin angenommen, dass sie die zwei Tabellen, Tabelle 1 und Tabelle 2, sind, verwendet in dem Beispiel der Bild-Codiervorrichtung. Die Binär-zu-Mehrtach-Wert-Konvertiereinrichtung (12303) führt eine Konversion an jedem Pixel eines Werts 255 durch, um seinen Wert in zwei Stufen, unter Verwendung der Tabellen 1 und 2, durch Bezugnahme auf deren vier Nachbarpixel, zu konvertieren, wie in 61 dargestellt ist.
  • Wie vorstehend beschrieben ist, wird, in der siebten und achten Ausführungsform, durch Verwendung der Eigenschaft eines Mehrfach-Wert-Bilds, dass nahezu alle Pixel in dem Bild gleichförmige, binäre Werte mit Zwischenwerten, verteilt entlang der Grenze, haben, der Zustand der Verteilung der Zwischenwerte analysiert, die Glättungsfunktion, die eine gute Annäherung der Zwischenwertverteilung liefert, wird abgeschätzt. Da diese Glättungsfunktion durch Mehrfachstufen ausgedrückt wird, gerade wenn der Zwischenwert eine Breite größer als oder gleich zu 2 Pixeln besitzt, kann irgendein Glättungsmuster für bis zu 8 Pixeln ausgedrückt werden. Irgendein Glättungsmuster hier bedeutet die ansteigende/abfallende Charakteristik an der Grenze.
  • (Ausführungsform B9)
  • 62 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer B9. Ausführungsform darstellt, die für das Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden. In der Figur ist eine Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (12601) eine Einrichtung, die ein Ziel-Bild (mit einem Bereich von 0 bis 255, wobei jedes eine ganze Zahl ist) als eine Eingabe aufnimmt und die das Eingabe-Ziel-Bild durch Zuordnen eines Werts von 0 zu Pixeln eines Werts 0 und einen Wert von 255 zu Pixeln mit anderen Werten binärisiert. Die Binär-Bild-Codiereinrichtung (12602) ist eine Einrichtung, die das binäre Bild, das Werte von {0, 255} besitzt, codiert, und die codierten Daten ausgibt. Eine Glättungsfunktion-Abschätzeinrichtung (12603) ist eine Einrichtung zur Bestimmung einer Glättungsfunktion.
  • Eine Glättungsfunktion-Codiereinrichtung (12604) ist eine Einrichtung zum Codieren der so bestimmten Funktion. Eine Binär-zu-Mehrfach-Wert-Konvertiereinrichtung (12605) ist eine Einrichtung, die die Glättungsfunktion und das binäre Bild als Eingaben heranzieht und das Mehrfach-Wert-Bild rekonstruiert. Ein Differenz-Kalkulator (12606) ist eine Einrichtung, die die Differenz zwischen dem Ausgang der Binär-zu-Mehrfach-Wert-Konvertiereinrichtung (12605) und das Ziel-Mehrfach-Wert-Bild erhält. Die restliche Codiereinrichtung (12607) ist eine Einrichtung zum Codieren der Differenz.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Ausführungsform wird nachfolgend beschrieben werden.
  • Die Blöcke mit den Bezugszeichen 2601 bis 2605 sind identisch in der Konfiguration und der Betriebsweise zu den Blöcken derselben Namen, die zuvor unter Bezugnahme auf die 58 und 59 beschrieben sind. In der vorliegenden Ausführungsform wird die Bild-Codiervorrichtung, dargestellt in der siebten Ausführungsform, als eine Vorhersage einrichtung verwendet. Das bedeutet, dass der Ausgang der Binär-zu-Mehrfach-Wert-Konvertiereinrichtung (12605) als ein vorhergesagtes Bild herangezogen wird und die Differenz des vorhergesagten Bilds durch den Differenz-Kalkulator (12606) erhalten wird, wobei die Differenz dann durch die Rest-Codiereinrichtung (12607) codiert wird.
  • Für das Codieren der Differenz wird der Zwischenrahmen-Codier-Mode (diskrete Cosinus-Transformations-Codierung), definiert in CCITT's International Standard für eine Bewegungs-Bild-Codierung N.261, verwendet.
  • (Ausführungsform B10)
  • 63 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Decodiervorrichtung gemäß einer 10. Ausführungsform darstellt, die für das Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden. Ausgaben von der Bild-Codiervorrichtung der neunten Ausführungsform werden als Eingaben zu der Decodiervorrichtung der vorliegenden Ausführungsform zugeführt.
  • In der Figur ist die Binär-Bild-Decodiereinrichtung (12701) eine Einrichtung, die den Ausgang der Binär-Bild-Codiereinrichtung (12602) als eine Eingabe aufnimmt und das binäre Bild von {0, 255} von den codierten Daten für das binäre Bild zurückgewinnt. Eine Glättungsfunktion-Decodiereinrichtung (12702) ist eine Decodiereinrichtung zum Decodieren der Ausgabe der Glättungsfunktion-Codiereinrichtung (12604). Eine Binär-zu-MehrFach-Wert-Konvertiereinrichtung (12703) ist eine Einrichtung, die die Glättungsfunktion und ein binäres Bild als Eingaben aufnimmt und die das Mehrfach-Wert-Bild rekonstruiert. Die Rest-Decodiereinrichtung (12704) ist eine Einrichtung, die die Ausgabe der Rest-Codiereinrichtung (12607) als eine Eingabe aufnimmt und den Rest erhält. Der Addieren (12705) addiert die Ausgänge der Binär-zu-Mehrfach-Wert-Konvertiereinrichtung (12703) und der Rest-Decodiereinrichtung (12704).
  • Die Betriebsweise der so konfigurierten Bild-Decodiervorrichtung der vorliegenden Ausführungsform wird nachfolgend beschrieben werden.
  • Die Blöcke mit den Bezugszeichen 2701 bis 2703 sind identisch in der Konfiguration und Betriebsweise zu den Blöcken derselben Namen, die zuvor unter Bezugnahme auf die 58 und 59 beschrieben sind. Die Rest-Decodiereinrichtung (12704) verwendet den Zwischen-Bild-Decodier-Mode, wie er in der Bewegungs-Bild-Codierung H.261 definiert ist, um dem Ausgang der Rest-Codiereinrichtung (12607) zu entsprechen. Das Diffe renzsignal, das die Differenz zwischen dem Ziel-Mehrfach-Wert-Bild in 41 und dem Bild, erhalten durch Glätten des binären Bilds, darstellt, wird demzufolge rekonstruiert, und das Differenzsignal wird in dem Addieren (12705) addiert, um das Mehrfach-Wert-Bild zu rekonstruieren. In der 9. und 10. Ausführungsform wird das Bild-Codierverfahren, dargestellt in der siebten und achten Ausführungsform, für eine Vorhersage verwendet, und die Vorhersage-Rest-Komponente wird separat codiert, übertragen und gespeichert, um dadurch eine akkuratere Reproduktion des Ziel-Mehrfach-Wert-Bilds zu erreichen. Insbesondere können, durch Vorhersagen einer abrupten Änderung in einem Wert an der Grenze, Hochfrequenzkomponenten von dem Restsignal entfernt werden, und die Effektivität einer diskreten Cosinus-Transformations-Codierung kann demzufolge verbessert werden.
  • (Ausführungsform B11)
  • 64 zeigt ein Blockdiagramm, das die Konfiguration einer Bild-Codiervorrichtung gemäß einer 11. Ausführungsform darstellt, die für das Verständnis der vorliegenden Erfindung hilfreich ist. Die Konfiguration dieser Ausführungsform wird nachfolgend unter Bezugnahme auf dieselbe Figur beschrieben werden.
  • In der Figur ist eine einen dynamischen Bereich abschätzende Einrichtung (20101) eine Einrichtung, die ein Ziel-Mehrfach-Wert-Bild als eine Eingabe aufnimmt, den Pixel-Wert des größten Bereichs und den Pixel-Wert des zweitgrößten Bereichs in dem Mehrfach-Wert-Bild extrahiert und sie als einen dynamischen Bereich ausgibt.
  • Eine Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (20103) ist eine Einrichtung, die eine Luminanz-Konversion unter Verwendung des dynamischen Bereichs durchführt und eine Schwellwertbildung unter Verwendung eines vorbestimmten Schwellwerts anwendet, um ein binäres Bild zu erzeugen.
  • Eine Glättungsfunktion-Abschätzeinrichtung (20102) ist eine Einrichtung, die, unter Berücksichtigung der Schwellwertbildung, durchgeführt in der Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (20103), Luminanz-Gradienten in dem Mehrfach-Wert-Bild analysiert und eine Glättungsfunktion abschätzt.
  • Eine einen dynamischen Bereich codierende Einrichtung (20105) ist eine Einrichtung, die den dynamischen Bereich codiert und die codierten Daten ausgibt.
  • Eine Glättungsfunktion-Codiereinrichtung (20106) ist eine Einrichtung, die die Glättungsfunktion codiert und die codierten Daten ausgibt.
  • Eine Binär-Bild-Codiereinrichtung (20104) ist eine Einrichtung, die das binäre Bild codiert und die codierten Daten ausgibt.
  • Die Betriebsweise der so konfigurierten Bild-Codiervorrichtung der vorliegenden Ausführungsform wird nachfolgend unter Bezugnahme auf die 40, 49, usw., zusammen mit der Betriebsweise eines Bild-Codierverfahrens gemäß einer Ausführungsform der vorliegenden Erfindung, beschrieben werden.
  • Die den dynamischen Bereich abschätzende Einrichtung (20101) extrahiert den Pixel-Wert des größten Bereich und den Pixel-Wert des zweitgrößten Bereichs in dem Mehrfach-Wert-Bild; in vielen Mehrfach-Wert-Bildern stimmen diese Pixel-Werte mit dem größten Pixel-Wert und dem kleinsten Pixel-Wert jeweils überein, so dass in der vorliegenden Ausführungsform der größte Pixel-Wert Dmax und der kleinste Pixel-Wert Dmin durch Abtasten des Ziel-Mehrfach-Wert-Bilds extrahiert werden.
  • Die Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (20103) führt eine lineare Konversion durch, wie in 40 dargestellt ist, und wendet eine Schwellwertbildung bei jedem Pixel-Wert an, unter Verwendung eines Schwellwerts von 128, so dass der maximale Wert Dmax auf 255 gesetzt wird und der minimale Wert Dmin auf 0 gesetzt wird.
  • Die Glättungsfunktion-Abschätzeinrichtung (20102) schätzt die Glättungsfunktion durch Berücksichtigen der Schwellwertbildung, durchgeführt durch die Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (20103), und den Durchschnitt der Gradienten der Pixel-Werte in dem Bild ab. In der vorliegenden Ausführungsform wird ein Durchschnitt-Filter mit einem Referenz-Punkt an seiner Mitte eingesetzt, da die Schwellwertbildung unter Verwendung eines Schwellwerts von 128 in der Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (20103) eingesetzt wird.
  • Die Größe des Durchschnitt-Filters wird durch den Durchschnitt der Gradienten der Pixel-Werte in denn Bild bestimmt.
  • Der Durchschnitt, daue, der Gradienten der Pixel-Werte in dem Bild wird in der folgenden Art und Weise berechnet.
  • In einer x-Richtung-Filterung (10301) wird der x-Richtung-Filter (10401) angewandt und über das Bild abgetastet, um den Gradienten entlang der x-Richtung in dem Bild zu erfassen.
  • In einer y-Richtung-Filterung (10302) wird der y-Richtung-Filter (10402) angewandt und über das Bild abgetastet, um den Gradienten entlang der y-Richtung in dem Bild zu erfassen.
  • Bei einer Gradienten-Erfassung (10303) wird ein Gradient d (i, j) durch Berechnen der Gleichung B1, angegeben in der ersten Ausführungsform, unter Verwendung des x-Richtung-Gradienten dx (i, j), erhalten durch die x-Richtung-Filterung (10301), und der y-Richtung-Gradient dy (i, j), erhalten durch die y-Richtung-Filterung (10302), erfasst, wobei (i, j) die Koordinaten auf dem Bild sind.
  • In der Gradienten-Richtung-Erfassung (10304) wird eine Gradienten-Richtung Θ (i, j) durch Berechnen der Gleichung B2, gegeben in der ersten Ausführungsform, unter Verwendung des x-Richtung-Gradienten dx (i, j), erhalten durch die x-Richtung-Filterung (10301) und den y-Richtung-Gradienten dy (i, j), erhalten durch die y-Richtung-Filterung (10302), erfasst, wobei (i, j) die Koordinaten auf dem Bild sind.
  • In der Nicht-Maximum-Wert-Unterdrückung (10305) wird, unter Verwendung eines Fensters, das sich mit Θ ändert, wie in 40 dargestellt ist, ein Bild in einer solchen Art und Weise erzeugt, dass dann, wenn der Wert des Gradienten an dem Referenz-Punkt innerhalb des Fensters ein maximaler Wert ist, der Bildbereich an den Koordinaten des Referenz-Punkts einem Wert von 1 zugeordnet wird; ansonsten wird der Bildbereich an den Koordinaten des Referenz-Punkts einem Wert von 0 zugeordnet.
  • Bei einer Durchschnitt-Gradienten-Erfassung (10306) wird ein Durchschnitt-Gradient d'ave durch Berechnung des Durchschnitts der Gradienten, erfasst in der Gradienten-Erfassung (10303), für die Pixel des Werts 1 in dem binären Bild, erhalten durch die Nicht-Maximum-Wert-Unterdrückung (10305), erhalten. Weiterhin wird, unter Verwendung des maximalen Pixel-Werts Dmax und des minimalen Pixel-Werts Dmin, erfasst durch die den dynamischen Bereich abschätzende Einrichtung (20101), ein normierter Durchschnitt-Gradient erneut aus der Gleichung B3, gegeben in der ersten Ausführungsform, berechnet, um daue zu erhalten.
  • Die Größe des Durchschnitt-Filters wird basierend auf dem normierten Durchschnitt-Gradienten daue und unter Bezugnahme auf 49 bestimmt.
  • Die das binäre Bild codierende Einrichtung (20104) codiert das binäre Bild unter Verwendung des Binär-Bild-Codier-Schemas MMR, definiert in CCITT's International Standard, traditionell verwendet für Facsimile-Systeme, usw., und gibt die codierten Daten aus.
  • Die Glättungsfunktion-Codiereinrichtung (20106) codiert die Glättungsfunktion, abgeschätzt durch die Glättungsfunktion-Abschätzeinrichtung (20102), und gibt die codierten Daten aus. In dem Fall der vorliegenden Ausführungsform wird die Größe des Durchschnitt-Filters zur Ausgabe als die decodierten Daten codiert.
  • Die den dynamischen Bereich codierende Einrichtung (20105) codiert individuell das Dmax und Dmin, erhalten durch die den dynamischen Bereich abschätzende Einrichtung (20101), und gibt die codierten Daten aus.
  • Wie vorstehend beschrieben ist, wird, in der vorliegenden Ausführungsform, durch Verwenden der Eigenschaft eines Mehrfach-Wert-Bilds, dass nahezu alle Pixel in dem Bild einen gleichförmigen, minimalen Wert oder maximalen Wert mit Zwischenwerten haben, verteilt entlang der Grenze, das Mehrfach-Wert-Bild in ein binäres Bild konvertiert, der Zustand der Verteilung der Zwischenwerte wird analysiert und eine Glättungsfunktion, die eine gute Annäherung der Zwischenwertverteilung liefert, wird abgeschätzt. Durch individuelles Codieren des abgeschätzten, maximalen Pixel-Werts und des minimalen Pixel-Werts, der abgeschätzten Glättungsfunktion und des abgeschätzten, binären Bilds und durch Ausgeben der Ergebnisse als codierte Daten, kann eine effiziente Codierung erreicht werden.
  • In jeder der vorstehend beschriebenen Ausführungsformen kann ein magnetisches Aufzeichnungsmedium oder ein optisches Aufzeichnungsmedium erzeugt werden, das ein Programm hält, damit ein Computer die Funktionen aller oder eines Teils der Einrichtungen ausführt, die bis hier beschrieben sind, so dass das Programm auf dem Computer laufen kann, um die vorstehend beschriebenen Operationen auszuführen.
  • Eine Bild-Codiervorrichtung ist in den vorstehenden Ausführungsformen so beschrieben worden, dass sie die den dynamischen Bereich abschätzende Einrichtung und deren Codiereinrichtung umfasst, allerdings ist dies nicht eine wesentliche Bedingung; zum Beispiel können, da, in vielen Fällen, Dmax 255 ist und Dmin 0 ist, beide der vorstehenden Einrichtungen weggelassen werden. In diesem Fall weist die Bild-Codiervorrichtung, wie sie in 65 dargestellt ist, eine Glättungsfunktion-Abschätzeinrichtung (10102) zum Abschätzen einer Glättungsfunktion von einem Ziel-Mehrfach-Wert-Bild auf, das das Bild ist, das codiert werden soll; eine Mehrfach-Wert-zu- Binär-Konvertiereinrichtung (10103) zum Konvertieren des Mehrfach-Wert-Bilds in ein binäres Bild entsprechend einem Mehrfach-Wert-zu-Binär-Konversions-Kriterium, bestimmt, um die abgeschätzte Glättungsfunktion anzupassen; eine Binär-Bild-Codiereinrichtung (10104) zum Codieren des binären Bilds und zum Ausgeben desselben als codierte Daten für das binäre Bild; und eine Glättungsfunktion-Codiereinrichtung (10106) zum Codieren der abgeschätzten Glättungsfunktion und zum Ausgeben derselben als codierte Daten für die Glättungsfunktion.
  • Gemäß dieser Konfiguration wird die Glättungsfunktion von dem Ziel-Mehrfach-Wert-Bild, das codiert werden soll, abgeschätzt; das Mehrfach-Wert-Bild wird in ein binäres Bild entsprechend dem Mehrfach-Wert-zu-Binär-Konversions-Kriterium, bestimmt dazu, die abgeschätzte Glättungsfunktion anzupassen, konvertiert; das binäre Bild wird codiert und als codierte Daten für das binäre Bild ausgegeben; und die abgeschätzte Glättungsfunktion wird codiert und als die codierten Daten für die Glättungsfunktion ausgegeben. In diesem Fall können ungefähr dieselben Effekte wie solche, erreicht in der ersten, beschriebenen Konfiguration, erhalten werden.
  • Weiterhin ist die Bild-Codiervorrichtung in den vorstehenden Ausführungsformen so beschrieben worden, dass sie die die Glättungsfunktion abschätzende Einrichtung umfasst, allerdings ist dies keine wesentliche Bedingung; zum Beispiel ist eine Konfiguration, die nicht eine eine Glättungsfunktion abschätzende Einrichtung umfasst, auch möglich. In diesem Fall weist die Bild-Codiervorrichtung, wie sie in 66 dargestellt ist, eine Mehrfach-Wert-zu-Binär-Konvertiereinrichtung zum Heranziehen eines Ziel-Mehrfach-Wert-Bilds, das codiert werden soll, und einer Glättungsfunktion als Eingaben, und zum Erzeugen eines binären Bilds von dem Mehrfach-Wert-Bild auf der Basis der Glättungsfunktion; eine Binär-Bild-Codiereinrichtung zum Codieren des binären Bilds und zum Ausgeben desselben als codierte Daten für das binäre Bild; und eine Glättungsfunktion-Codiereinrichtung zum Codieren der Glättungsfunktion und zum Ausgeben derselben als codierte Daten für die Glättungsfunktion, auf. Die Glättungsfunktion ist eine vorbestimmte Funktion, die so eingestellt ist, dass das originale Mehrfach-Wert-Bild, tatsächlich oder in einer angenäherten Weise, wiedergegeben werden könnte, falls die Glättungsfunktion auf das binäre Bild angewandt werden würde. Gemäß dieser Konfiguration werden das Ziel-Mehrfach-Wert-Bild, das codiert werden soll, und die Glättungsfunktion eingegeben; das binäre Bild wird aus dem Mehrfach-Wert-Bild auf der Basis der Glättungsfunktion erzeugt; das binäre Bild wird codiert und als codierte Daten für das binäre Bild ausgegeben; und die Glättungsfunktion wird codiert und als codierte Daten für die Glättungsfunktion ausgegeben. In diesem Fall können auch ungefähr dieselben Effekte wie solche, erreicht in der ersten, beschriebenen Konfiguration, erhalten werden.
  • Die Bild-Codiervorrichtung ist in der Ausführungsform, dargestellt in 66, so beschrieben worden, dass sie nicht die den dynamischen Bereich abschätzende Einrichtung, usw., umfasst, allerdings ist dies keine wesentliche Bedingung; zum Beispiel ist eine Konfiguration, umfassend die den dynamischen Bereich abschätzende Einrichtung, usw., auch möglich. In diesem Fall weist die Bild-Codiervorrichtung, zusätzlich zu den Elementen, die in 66 dargestellt sind, die den dynamischen Bereich abschätzende Einrichtung zum Erhalten des dynamischen Bereichs von dem Ziel-Mehrfach-Wert-Bild und die den dynamischen Bereich codierende Einrichtung zur Codierung des dynamischen Bereichs und zum Ausgeben desselben als codierte Daten für den dynamischen Bereich, auf, wie in 67 dargestellt ist. In dieser Konfiguration erzeugt die Mehrfach-Wert-zu-Binär-Konvertiereinrichtung das binäre Bild auch unter Berücksichtigung des dynamischen Bereichs. In dieser Betriebsweise setzt diese Konfiguration, zusätzlich zu der Betriebsweise, die in Verbindung mit der Konfiguration der 66 beschrieben ist, ein Erhalten des dynamischen Bereichs von dem Ziel-Mehrfach-Wert-Bild, Codieren des dynamischen Bereichs und Ausgeben desselben als die codierten Daten für den dynamischen Bereich, ein.
  • Weiterhin ist die Bild-Codiervorrichtung in der Ausführungsform, die in 64 dargestellt ist, so beschrieben worden, dass sie die den dynamischen Bereich abschätzende Einrichtung, usw., umfasst, allerdings ist dies keine wesentliche Bedingung; zum Beispiel ist eine Konfiguration, die nicht die den dynamischen Bereich abschätzende Einrichtung, usw., umfasst, auch möglich. In diesem Fall weist die Bild-Codiervorrichtung, wie sie in 68 dargestellt ist, eine Mehrfach-Wert-zu-Binär-Konvertiereinrichtung (20103) zum Konvertieren eines Ziel-Mehrfach-Wert-Bilds, des Bilds, das codiert werden soll, zu einem binären Bild entsprechend einem Mehrfach-Wert-zu-Binär-Konversions-Kriterium, bestimmt so, um das Mehrfach-Wert-Bild anzupassen; eine eine Glättungsfunktion abschätzende Einrichtung (20102) zum Abschätzen einer Glättungsfunktion so, dass das Original-Mehrfach-Wert-Bild, tatsächlich oder in einer angenäherten Art und Weise, wiedergegeben werden könnte, falls dieselbe Glättungsfunktion auf das binäre Bild angewandt wird; eine Binär-Bild-Codiereinrichtung (20104) zum Codieren des binären Bilds und zum Ausgeben desselben als codierte Daten für das binäre Bild; und eine Glättungsfunktion-Codiereinrichtung (20106) zum Codieren der abgeschätzten Glättungsfunktion und zum Ausgeben derselben als codierte Daten für die Glättungsfunktion; auf. Gemäß dieser Konfiguration wird das Mehrfach-Wert-Bild in das binäre Bild entsprechend dem Mehrfach-Wert-zu-Binär-Konversions-Kriterium konvertiert, bestimmt so, um das Ziel-Mehrfach-Wert-Bild, das codiert werden soll, anzupassen; die Glättungsfunktion, die, tatsächlich oder in einer angenäherten Art und Weise, das Original-Mehrfach-Wert-Bild wiedergeben könnte, falls es auf das binäre Bild angewandt wird, wird abgeschätzt; das binäre Bild wird codiert und als die codierten Daten für das binäre Bild ausgegeben; und die abgeschätzte Glättungsfunktion wird codiert und als codierte Daten für die Glättungsfunktion ausgegeben.
  • Die Bild-Decodiervorrichtung ist in den vorstehenden Ausführungsformen so beschrieben worden, dass sie die den dynamischen Bereich decodierende Einrichtung umfasst, allerdings ist dies keine wesentliche Bedingung; zum Beispiel ist eine Konfiguration, die nicht die den dynamischen Bereich decodierende Einrichtung umfasst, auch möglich. In diesem Fall besitzt die Bild-Decodiervorrichtung die Konfiguration, die die verschiedenen Arten von codierten Daten, ausgegeben von der Bild-Codiervorrichtung, dargestellt in 58, 65, 66 oder 68, annimmt, und weist auf, wie in 69 dargestellt ist, eine das binäre Bild decodierende Einrichtung zum Zurückgewinnen des binären Bilds durch Decodieren der codierten Daten für das binäre Bild von den codierten Daten; eine Glättungsfunktion-Decodiereinrichtung zum Zurückgewinnen der Glättungsfunktion durch Decodieren der codierten Daten für die Glättungsfunktion von den codierten Daten; und eine Binärzu-Mehrfach-Wert-Konvertiereinrichtung zum Zurückgewinnen des Mehrfach-Wert-Bilds durch Glätten des decodierten, binären Bilds unter Verwendung der decodierten Glättungsfunktion. Gemäß dieser Konfiguration werden die verschiedenen Arten von codierten Daten, ausgegeben von irgendeiner der Bild-Codiervorrichtungen, eingegeben; von den codierten Daten werden die codierten Daten für das binäre Bild decodiert, um das binäre Bild zurückzugewinnen; von den codierten Daten werden die codierten Daten für die Glättungsfunktion decodiert, um die Glättungsfunktion zurückzugewinnen; und das Mehrfach-Wert-Bild wird durch Glätten des decodierten, binären Bilds unter Verwendung der decodierten Glättungsfunktion zurückgewonnen. In diesem Fall können auch ungefähr dieselben Effekte wie solche, die in der ersten, beschriebenen Konfiguration erreicht wer den, erhalten werden. In diesem Fall können auch ungefähr dieselben Effekte wie solche der ersten, beschriebenen Konfiguration erhalten werden.
  • Unter Verwendung der vorstehend beschriebenen Bild-Decodiervorrichtung und des Bild-Decodierverfahrens der vorliegenden Erfindung kann eine effizientere Decodierung erreicht werden als dann, wenn Mehrfach-Wert-Bild-Codiertechniken nach dem Stand der Technik verwendet werden, aus den Gründen, die nachfolgend angegeben sind.
  • 1. In einem Mehrfach-Wert-Bild wird die Verteilung von Zwischenwerten entlang der Grenze zwischen dem Bereich des maximalen Werts, der einen Hauptbereich des Bilds belegt, und dem Bereich des minimalen Werts, der auch einen Hauptbereich belegt, analysiert, und die Glättungsfunktion, die eine gute Annäherung der Verteilung liefert, wird bestimmt.
  • 2. Basierend auf der Glättungsfunktion, bestimmt in 1, wird ein binäres Bild erzeugt, das nur zwei Werte besitzt, den maximalen Wert und den minimalen Wert.
  • 3. Das Mehrfach-Wert-Bild wird durch die Glättungsfunktion, bestimmt in 1, und das binäre Bild, erzeugt in 2 und entsprechend codiert, ausgedrückt.
  • 4. An dem Decodieren werden die codierte Glättungsfunktion und das binäre Bild decodiert, um das Mehrfach-Wert-Bild zu rekonstruieren.
  • Wie aus der vorstehenden Beschreibung ersichtlich ist, besitzt die vorliegende Erfindung den Vorteil, dass sie in der Lage ist, eine effizientere Decodierung zu erreichen, als sie nach dem Stand der Technik erreicht werden kann.
  • INDUSTRIELLE ANWENDBARKEIT
  • Wie vorstehend beschrieben ist, kann, durch Vorhersagen eines Pixels, das codiert werden soll, von, zum Beispiel, einem zuvor erhaltenen, binären Bild, das eine hohe Korrelation besitzt, und durch Codieren seiner Differenz, eine effizientere Codierung und Decodierung erreicht werden. Weiterhin wird die Verteilung von Zwischenwerten, zum Beispiel, analysiert, und eine Glättungsfunktion, die die Verteilung annähert, und ein binäres Basis-Bild, das nur zwei Werte besitzt, den maximalen Wert und den minimalen Wert, werden jeweils codiert und dann decodiert, um dadurch eine effizientere Codierung und Decodierung zu erreichen.

Claims (8)

  1. Bilddekodiervorrichtung zum Dekodieren kodierter Daten eines binären Bildes unter Verwendung eines arithmetischen Dekoders (1201) gekennzeichnet durch eine Referenzblock-Übernahmesteuereinrichtung (1205) zur Umschaltung der Dekodierverarbeitung der kodierten Daten eines Zielblocks (2502) in Abhängigkeit von einem Referenzblock-Übernahmebestimmungssignal zur Dekodierung der kodierten Daten des Zielblocks (2502) durch eine Blockbildungseinrichtung (1202), eine Statistikmodell-Auswahleinrichtung (1203) und die arithmetische Dekodiereinrichtung (1201), wenn das Referenzblock-Übernahmebestimmungssignal angibt, dass ein Referenzblock zu übernehmen ist, wobei die Blockbildungseinrichtung (1202) so eingerichtet ist, dass sie einen Referenzblock (2501) eines binären Referenzbildes erhält, das zuvor erhalten wurde, die Statistikmodell-Auswahleinrichtung (1203) so eingerichtet ist, dass sie für ein Zielpixel (2502a) eines Zielblocks (2502) ein Statistikmodell aus einer Mehrzahl von Statistikmodellen basierend auf den Zuständen von Pixeln (J, K, L, M), die das Zielpixel (2502a) umgeben, und den Zuständen von Pixeln (A, B, C, D, E, F, G, H, I) auswählt, die ein Pixel (2501a) in dem Referenzblock (2501) an einer Position, die der Position des Zielpixels (2502a) in dem Zielblock (2502) entspricht, umgeben, und die arithmetische Dekodiereinrichtung (1201) so eingerichtet ist, dass sie das Zielpixel (2502a) aus den kodierten Daten unter Verwendung des ausgewählten Statistikmodells dekodiert.
  2. Bilddekodiervorrichtung nach Anspruch 1, wobei die Pixel, die das Pixel (2501a) in dem Referenzblock (2501) umgeben, Pixel (A–I) an einer Position innerhalb einer Ein-Pixel-Distanz von dem Pixel (2501a) sind.
  3. Bilddekodiervorrichtung nach Anspruch 1, wobei die Pixel, die das Pixel (2501a) in dem Referenzblock (2501) umgeben, vier Pixel (B, H, D, F) an Positionen unmittelbar oberhalb, unmittelbar unterhalb, unmittelbar links und unmittelbar rechts des Pixels (2501a) sind.
  4. Bilddekodiervorrichtung nach einem der Ansprüche 1 bis 3, wobei die Pixel (K, M, J, L), die das Zielpixel (2502a) umgeben, an Positionen unmittelbar oberhalb, unmittelbar links, unmittelbar links oberhalb und unmittelbar rechts oberhalb des Zielpixels (2502a) angeordnet sind.
  5. Bilddekodierverfahren zum Dekodieren kodierter Daten eines binären Bildes durch arithmetisches Dekodieren, gekennzeichnet durch die Schritte: Umschalten der Dekodierverarbeitung der kodierten Daten eines Zielblocks (2502) in Abhängigkeit von einem Referenzblock-Übernahmebestimmungssignal zur Dekodierung der kodierten Daten des Zielblocks (2502) durch Ausführung eines Blockbildungsschrittes, eines Statistikmodell-Auswahlschrittes und eines arithmetischen Dekodierschrittes, wenn das Referenzblock-Übernahmebestimmungssignal angibt, dass ein Referenzblock zu übernehmen ist, wobei der Blockbildungsschritt einen Referenzblock (2501) aus einem binären Referenzbild erhält, das zuvor erhalten wurde, der Statistikmodell-Auswahlschritt für ein Zielpixel (2502a) des Zielblocks (2502) ein Statistikmodell aus einer Mehrzahl von Statistikmodellen basierend auf den Zuständen der Pixel (J, K, L, M), die das Zielpixel (2502a) umgeben, und den Zuständen der Pixel (A, B, C, D, E, F, G, N, 1) auswählt, die ein Pixel (2501a) in dem Referenzblock (2501) an einer Position, die der Position des Zielpixels (2502a) in dem Zielblock (2502) entspricht, umgeben, und der arithmetische Dekodierschritt das Zielpixel (2502a) aus den kodierten Daten unter Verwendung des ausgewählten statistischen Modells dekodiert.
  6. Bilddekodierverfahren nach Anspruch 5, wobei die Pixel, die das Pixel (2501a) in dem Referenzblock (2501) umgeben, Pixel (A–I) an Positionen innerhalb einer Ein-Pixel-Distanz von dem Pixel (2501a) sind.
  7. Bilddekodierverfahren nach Anspruch 5, wobei die Pixel, die das Pixel (2501a) in dem Referenzblock (2501) umgeben, vier Pixel (B, H, D, F) an Positionen unmittelbar oberhalb, unmittelbar unterhalb, unmittelbar links und unmittelbar rechts des Pixels (2501a) sind.
  8. Bilddekodierverfahren nach einem der Ansprüche 5 bis 7, wobei die Pixel (K, M, J, L), die das Zielpixel (2502a) umgeben, unmittelbar oberhalb, unmittelbar links, unmittelbar links oberhalb und unmittelbar rechts oberhalb des Zielpixels (2502a) positioniert sind.
DE69725765T 1996-07-31 1997-07-25 Bilddekoder und Verfahren zur Bilddekodierung Expired - Lifetime DE69725765T2 (de)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP20234696 1996-07-31
JP20234696 1996-07-31
JP25807796 1996-09-30
JP25807796 1996-09-30
JP27917096 1996-10-22
JP27917096 1996-10-22

Publications (2)

Publication Number Publication Date
DE69725765D1 DE69725765D1 (de) 2003-11-27
DE69725765T2 true DE69725765T2 (de) 2004-04-29

Family

ID=27328081

Family Applications (3)

Application Number Title Priority Date Filing Date
DE69715426T Expired - Lifetime DE69715426T2 (de) 1996-07-31 1997-07-25 Verfahren und vorrichtung zur bilddekodierung
DE69725765T Expired - Lifetime DE69725765T2 (de) 1996-07-31 1997-07-25 Bilddekoder und Verfahren zur Bilddekodierung
DE69720560T Expired - Lifetime DE69720560T2 (de) 1996-07-31 1997-07-25 Bilddekoder und Bilddekodierungsverfahren

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE69715426T Expired - Lifetime DE69715426T2 (de) 1996-07-31 1997-07-25 Verfahren und vorrichtung zur bilddekodierung

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE69720560T Expired - Lifetime DE69720560T2 (de) 1996-07-31 1997-07-25 Bilddekoder und Bilddekodierungsverfahren

Country Status (9)

Country Link
US (4) US6404932B1 (de)
EP (3) EP0917351B1 (de)
KR (4) KR100422943B1 (de)
CN (4) CN1196319C (de)
AT (3) ATE236490T1 (de)
DE (3) DE69715426T2 (de)
ES (2) ES2184117T3 (de)
TW (1) TW366668B (de)
WO (1) WO1998005159A1 (de)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1178461C (zh) * 1998-06-09 2004-12-01 松下电器产业株式会社 图像编码装置、图像译码装置、传真装置
US6721457B1 (en) * 1999-08-27 2004-04-13 Hewlett-Packard Development Company, L.P. Method for enhancing digital images
JP2002064821A (ja) * 2000-06-06 2002-02-28 Office Noa:Kk 動画像情報の圧縮方法およびそのシステム
US7221483B2 (en) * 2000-09-05 2007-05-22 Ricoh Company, Ltd. Image encoding method and apparatus, image decoding method and apparatus, image processing apparatus, image formation apparatus, and computer-executable programs
US6888968B1 (en) * 2000-09-21 2005-05-03 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
US7171444B2 (en) * 2001-11-14 2007-01-30 Sharp Laboratories Of America, Inc. Remote desktop protocol compression system
US9577667B2 (en) * 2002-04-23 2017-02-21 Ntt Docomo, Inc. System and method for arithmetic encoding and decoding
EP1504408B1 (de) * 2002-04-23 2015-10-28 NTT DoCoMo, Inc. System und verfahren zur arithmetischen codierung
US7321623B2 (en) 2002-10-01 2008-01-22 Avocent Corporation Video compression system
US7738552B2 (en) * 2002-12-06 2010-06-15 Broadcom Company Processing data streams
US9560371B2 (en) * 2003-07-30 2017-01-31 Avocent Corporation Video compression system
CN1655620B (zh) * 2004-02-09 2010-09-22 三洋电机株式会社 图像显示装置
US7457461B2 (en) * 2004-06-25 2008-11-25 Avocent Corporation Video compression noise immunity
US7720295B2 (en) * 2004-06-29 2010-05-18 Sanyo Electric Co., Ltd. Method and apparatus for coding images with different image qualities for each region thereof, and method and apparatus capable of decoding the images by adjusting the image quality
JP4656912B2 (ja) * 2004-10-29 2011-03-23 三洋電機株式会社 画像符号化装置
JP2006129248A (ja) * 2004-10-29 2006-05-18 Sanyo Electric Co Ltd 画像符号化方法および装置、ならびに画像復号方法および装置
EP2016767A4 (de) * 2006-04-28 2014-08-13 Avocent Corp Dvc-delta-befehle
JP4993676B2 (ja) * 2006-09-01 2012-08-08 キヤノン株式会社 画像符号化装置及び画像符号化方法
JP5054981B2 (ja) 2007-01-12 2012-10-24 キヤノン株式会社 撮像装置及び撮像処理方法
KR101012275B1 (ko) * 2008-04-29 2011-02-07 주식회사 영진공영 배관 파이프 지지장치
KR101710619B1 (ko) * 2009-02-04 2017-02-28 삼성전자주식회사 단계적인 영상 부호화, 복호화 방법 및 장치
JP5210198B2 (ja) * 2009-02-13 2013-06-12 オリンパス株式会社 画像処理装置、画像処理方法、画像処理プログラム
AU2009251048B2 (en) * 2009-12-18 2013-12-19 Canon Kabushiki Kaisha Background image and mask estimation for accurate shift-estimation for video object detection in presence of misalignment
US8968080B1 (en) 2010-11-05 2015-03-03 Wms Gaming, Inc. Display of third party content on a wagering game machine
JP5744614B2 (ja) * 2011-04-28 2015-07-08 オリンパス株式会社 画像処理装置、画像処理方法、および、画像処理プログラム
EP4020989A1 (de) * 2011-11-08 2022-06-29 Nokia Technologies Oy Handhabung von referenzbildern
US9286323B2 (en) * 2013-02-25 2016-03-15 International Business Machines Corporation Context-aware tagging for augmented reality environments
US9984305B2 (en) * 2016-04-19 2018-05-29 Texas Instruments Incorporated Efficient SIMD implementation of 3x3 non maxima suppression of sparse 2D image feature points
US10430987B1 (en) * 2017-06-09 2019-10-01 Snap Inc. Annotating an image with a texture fill
CN117354540A (zh) * 2017-10-27 2024-01-05 松下电器(美国)知识产权公司 编码装置、编码方法、生成装置、发送装置和存储介质
WO2020180424A1 (en) 2019-03-04 2020-09-10 Iocurrents, Inc. Data compression and communication using machine learning
CN114061524A (zh) * 2021-10-15 2022-02-18 首钢集团有限公司 一种钢卷轮廓测量方法及装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6229372A (ja) 1985-07-31 1987-02-07 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 2値デ−タの圧縮方法
JP2584840B2 (ja) * 1988-08-30 1997-02-26 キヤノン株式会社 画像の階層的符号化装置
JPH02274080A (ja) * 1989-04-14 1990-11-08 Sharp Corp 画像符号化伝送方式
JP2675903B2 (ja) * 1990-05-30 1997-11-12 キヤノン株式会社 画像符号化方式
JPH04306970A (ja) * 1991-04-04 1992-10-29 Canon Inc 画像処理方法及び装置
EP0523939B1 (de) 1991-07-15 1998-10-07 Canon Kabushiki Kaisha Bildkodierung
US5442458A (en) * 1991-12-18 1995-08-15 Eastman Kodak Company Method and associated apparatus for encoding bitplanes for improved coding efficiency
JP3068304B2 (ja) * 1992-01-21 2000-07-24 日本電気株式会社 動画像符号化方式および復号化方式
DE69320147T2 (de) 1992-11-13 1999-01-14 Canon Kk Vorrichtung zur Bildkodierung
JP3470763B2 (ja) 1993-01-21 2003-11-25 沖電気工業株式会社 画像符号化及び復号化装置
US5471207A (en) * 1994-02-23 1995-11-28 Ricoh Company Ltd. Compression of palettized images and binarization for bitwise coding of M-ary alphabets therefor
JPH07254990A (ja) * 1994-03-14 1995-10-03 Ricoh Co Ltd 画像通信装置
US5486863A (en) 1994-04-29 1996-01-23 Motorola, Inc. Method for determining whether to intra code a video block
US5608458A (en) * 1994-10-13 1997-03-04 Lucent Technologies Inc. Method and apparatus for a region-based approach to coding a sequence of video images
DE69533870T2 (de) * 1994-10-19 2005-05-25 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Bilddekodierung
EP1098527A1 (de) 1994-11-04 2001-05-09 Matsushita Electric Industrial Co., Ltd. Bildkodierungs- und -dekodierungsvorrichtung
JPH08140085A (ja) * 1994-11-04 1996-05-31 Matsushita Electric Ind Co Ltd 多値信号符号化方法および多値信号復号化方法
US5689589A (en) * 1994-12-01 1997-11-18 Ricoh Company Ltd. Data compression for palettized video images
EP0717554B1 (de) * 1994-12-16 2001-06-06 Canon Kabushiki Kaisha Kodier- und Dekodiervorrichtung und -verfahren
US5659631A (en) * 1995-02-21 1997-08-19 Ricoh Company, Ltd. Data compression for indexed color image data
JP3086396B2 (ja) * 1995-03-10 2000-09-11 シャープ株式会社 画像符号化装置及び画像復号装置
MY121607A (en) * 1995-07-10 2006-02-28 Hyundai Curitel Inc Grid moving method of object image and apparatus using the same and compaction/motion estimation method using the same and apparatus thereof
US5883678A (en) * 1995-09-29 1999-03-16 Kabushiki Kaisha Toshiba Video coding and video decoding apparatus for reducing an alpha-map signal at a controlled reduction ratio

Also Published As

Publication number Publication date
ATE224121T1 (de) 2002-09-15
ATE252805T1 (de) 2003-11-15
US6490373B2 (en) 2002-12-03
US20010031089A1 (en) 2001-10-18
DE69720560D1 (de) 2003-05-08
ES2195968T3 (es) 2003-12-16
CN1178460C (zh) 2004-12-01
WO1998005159A1 (en) 1998-02-05
US6510250B2 (en) 2003-01-21
KR20030096438A (ko) 2003-12-31
US6760480B2 (en) 2004-07-06
EP1120973A2 (de) 2001-08-01
KR20030096440A (ko) 2003-12-31
EP0917351B1 (de) 2002-09-11
DE69720560T2 (de) 2003-11-27
EP1158805A1 (de) 2001-11-28
KR100437187B1 (ko) 2004-06-23
KR100422935B1 (ko) 2004-03-12
KR20030096439A (ko) 2003-12-31
TW366668B (en) 1999-08-11
DE69725765D1 (de) 2003-11-27
CN1322085A (zh) 2001-11-14
EP1158805B1 (de) 2003-10-22
DE69715426T2 (de) 2003-01-09
KR100422943B1 (ko) 2004-03-12
CN1196319C (zh) 2005-04-06
CN1178458C (zh) 2004-12-01
EP0917351A1 (de) 1999-05-19
CN1339914A (zh) 2002-03-13
US20020090139A1 (en) 2002-07-11
KR100422939B1 (ko) 2004-03-12
ATE236490T1 (de) 2003-04-15
ES2184117T3 (es) 2003-04-01
CN1196342C (zh) 2005-04-06
US6404932B1 (en) 2002-06-11
EP1120973B1 (de) 2003-04-02
CN1339915A (zh) 2002-03-13
US20010024525A1 (en) 2001-09-27
KR20000029714A (ko) 2000-05-25
DE69715426D1 (de) 2002-10-17
US20030086621A1 (en) 2003-05-08
EP0917351A4 (de) 2000-11-22
CN1231797A (zh) 1999-10-13
EP1120973A3 (de) 2001-11-07

Similar Documents

Publication Publication Date Title
DE69725765T2 (de) Bilddekoder und Verfahren zur Bilddekodierung
DE69627982T2 (de) Signaladaptives Nachverarbeitungssystem um Blockierungseffekte und Ringstörungen zu verringern
US6226050B1 (en) Signal adaptive filtering method for reducing ringing noise and signal adaptive filter
Amin-Naji et al. Multi-focus image fusion in DCT domain using variance and energy of Laplacian and correlation coefficient for visual sensor networks
US6668097B1 (en) Method and apparatus for the reduction of artifact in decompressed images using morphological post-filtering
US7551792B2 (en) System and method for reducing ringing artifacts in images
US6259823B1 (en) Signal adaptive filtering method and signal adaptive filter for reducing blocking effect and ringing noise
CN101563926B (zh) 图像压缩与解压缩
US6853755B2 (en) Method and apparatus for adaptive compression of scanned documents
DE69533870T2 (de) Vorrichtung zur Bilddekodierung
EP1281164A2 (de) System zur ortung der visuellen aufmerksamkeit
EP0577350A2 (de) Vorrichtung zur Kodierung und Dekodierung von Bildsignalen mit adaptivem Filter zur Randverhaltensverbesserung
DE602004001993T2 (de) Transformations basiertes restbewegungsrahmen kodierungsverfahren mit übervollständiger basis und zugehörige vorrichtung zur videokompression
DE69630199T2 (de) Verfahren und gerät zur selektiven kompression von video-codec
Sandić-Stanković et al. Fast blind quality assessment of DIBR-synthesized video based on high-high wavelet subband
EP0389044B1 (de) Bildsignalverarbeitung
Abdollahzadeh et al. Multi-focus image fusion for visual sensor networks
Casas et al. Coding of details in very low bit-rate video systems
JP2005318614A (ja) 入力画像中のアーチファクトを低減する方法
Rajala et al. A second generation image coding technique using human visual system based segmentation
Casas et al. Strong edge features for image coding
Li et al. Segmentation based coding of motion compensated prediction error images
EP0544258B1 (de) Bilddatenkompressionsmethode
JP2642001B2 (ja) 画像処理方法
Peterson Image segmentation using human visual system properties with applications in image compression

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: PANASONIC CORP., KADOMA, OSAKA, JP