WO1999038262A1

WO1999038262A1 - Variable-length encoder

Info

Publication number: WO1999038262A1
Application number: PCT/JP1999/000201
Authority: WO
Inventors: Akihiro Watabe; Eiji Miyagoshi
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 1998-01-21
Filing date: 1999-01-20
Publication date: 1999-07-29
Also published as: EP1058391A1; EP1058391A4; KR100384102B1; CN1169304C; US6741651B1; JP3416649B2; KR20010034304A; CN1294786A

Description

明細書可変長符号化装置技術分野

本発明はデータの圧縮処理で利用される可変長符号化装置に関する。背景技術

従来の可変長符号化装置の代表的な用途として動画データの圧縮処理力 ^Sある。

動画圧縮の国際規格である M P E G (Moving Picture Experts Group)では、 D C T (離散コサイン変換）、量子化、動き補償を伴う差分処理を行う。 M P E Gではマクロブロックと呼ばれる縦 1 6、横 1 6の画素で構成される単位をベースに動き補償を行って圧縮率の向上を図っている。

M P E Gにおいては可変長符号化を行なっているが、この可変長符号化は確率的に符号長を減少するものであるため必ずしも符号化ビット発生量が減少するとは限らず、また画像データ、映像の動きなどピクチャのコーディングの困難さに応じて符号化ビット発生量が揺らぐことになる。

このビット発生量の摇らぎはデコーダのバッファモデルによつて規定される。具体的には、規格によって規定される理想的なデコーダにおいては入力バッファが存在し、リアルタイムデコードにおいてこの入カバッファがオーバーフロー、あるいはアンダーフローしてはならないという規定がなされている。よってエンコーダはデコーダの入力バッファの容量の程度のビット発生量の揺らぎが許されていることになる。逆にいえばこの制限をエンコーダでは必ず守られるようにェンコ一ドしなければならない。

このように、 M P E Gでは、可変長符号でェンコ一ドするのであるが、そのビット発生量に関し制限を与えなければならない。一般的にその手法はレートコントロールと呼ばれている。このようなレートコントロールについては例えば特開平 7— 1 0 7 9 4 7号公報に開示されているのように、通常量子化する際のステップを変化させる手法などが知られている。また、可変長符号化を行なったのちに、ビット発生量を制御する方法としては特開平 6 - 1 4 3 1 4号公報などに開示された手法が知られている。

しかし、量子化ステップを大きくする方法によると、符号化ビット発生量は減少することが予想されるが、実際の符号化ビット発生量は符号化を行なうまでは不明である。このように、正確に符号量を予測できない以上、量子化ステップで制御する方法では、確実性に欠けるという問題がある。このように従来の手法では、量子化ステップをマクロブロック単位で変更する方法によっても非常に頻度が低いと思われる状況を想定して符号化ビット発生量の上限を確実に押えなければならないため、通常はもつと高画質が得られるはずのデータに対しても画質の劣化を招くという問題があった。特に、リアルタイムでのシステムにおいては、ェンコ一ドした結果を参照してさらに最適化を図るなどの再ェンコ一ド処理が殆んど不可能であるためこのような安全策を採らざるを得ず画質の劣化を招いていた。

これらの問題は可変長符号化を行なったのちに制御を行なうことにすれば解決するが、特開平 6 - 1 4 3 1 4号公報に開示されている手法では、全ての可変長符号の長さを記憶しておく必要があるなどハードゥエァの規模が増大し、またローカルデコード画像と、デコーダによるデコ一ド画像のずれが生じて画質の劣化が数フレームに渡って継続するといつた状況が発生する。さらに画質劣化が特定のマクロプロックに集中することがあり、画質劣化が顕著に表われやすい問題があった。発明の開示

本発明にかかる可変長符号化装置は、上記課題を解決し、リアルタイム処理において符号化ビット発生量の上限を画質劣化が目立たないように確実に制限することを目的とする。

上記目的を達成するために本発明にかか · 5可変長符号化装置は、入力されたデータを処理単位毎に可変長符号化する可変長符号化手段と、前記可変長符号化された可変長符号化データを一時的に記憶するバッファリング手段と、前記バッファリング手段に記憶された可変長符号化データの処理単位当たりの符号発生量に応じて、あらかじめ用意された前記符号発生量より短い符号に置き換える符号置き換え処理手段を具備することを特徴とする。

上記構成により、可変長符号化の結果、処理単位当たりの符号発生量が多いものを必要に応じて短い符号で置き換えることにより処理単位当たりの符号量を低減させ、確実に符号発生量の上限を制限でき、符号発生量を所定範囲に抑えることができる。

次に、前記可変長符号化装置は、前記入力データの処理単位当たりの符号発生量の上限値を設定する手段を備え、前記符号置き換え処理手段力前記バッファリング手段に記憶された可変長符号化データの処理単位当たりの符号発生量が前記上限値を越えた場合にあらかじめ用意された短い符号に置き換える処理をする手段と、前記バッファリング手段に記憶された可変長符号化データの処理単位当たりの符号発生量が前記上限値を越えない場合に符号の置き換えを行わない処理をする手段とを備えることが好ましい。上記構成により、処理単位当たりの符号発生量の上限を柔軟に設定でき、可変長符号化の結果、処理単位当たりの符号化ビット発生量が上限値を越えたものを短い符号で置き換えることにより処理単位当たりの符号量を確実に上限値以内に制限できる。

次に、前記入力は動画像データのフレーム内圧縮処理またはフレーム間圧縮処理されたデータであって、前記処理単位は、動画像データの 1 ピクチャ当たりのデータであることが好ましい。

上記構成により、動画像データの圧縮処理過程の可変長符号化処理に適用することができ、 M P E G、 H . 2 6 1などの動画圧縮処理装置の可変長符号処理に利用することができる。

次に、前記符号置き換え処理手段が置き換えるあらかじめ用意された短い符号が、すでに前記符号置き換え処理手段による処理が済んだ処理単位にかかる置き換え処理済データと同じデコード結果が得られるものであることが好ましい。

上記構成により、置き換えたデータをデコードする際にすでにデコードした画像と同一の画像となるので、画質の劣化を感じさせることがなレ、。

次に、前記入力データが双方向予測符号化画像ピクチヤである場合、前記符号置き換え処理手段は、前記置き換えるあらかじめ用意された短い符号とし、時系列上、前方でもっとも近いフレーム内符号化画像ピクチヤか、前方でもっとも近い前方予測符号化画像ピクチャか、後方でもつとも近いフレーム内符号化画像ピクチャか、後方でもつとも近い前方予測符号化画像ピクチャのうちのいずれかと、同じデコード結果が得られるデータを選択することが好ましい。

上記構成により、置き換える必要のある双方向予測符号化画像ピクチャデータを、時間的に近接する前後のピクチャであって、所定の符号発生量に収まった画像データと置き換えることができ、動画像としてデコ一ドした場合の違和感のないデータを得ることができる。

さらに、前記選択において後方の画像ピクチャを選んだ場合は、前記入力データから前記選択した後方の画像ピクチヤまでの間にある双方向予測符号化画像ピクチヤすベてを前記選択した後方の画像ピクチャと同じデコード結果が得られるデータと置き換えることが好ましい。

上記構成により、双方向予測符号化画像ピクチャデータの置き換え処理において、置き換えた画像ピクチャに後続する画像ピクチャが時系列上過去のデータとなることがなく、デコードした場合、画像の時間的順番が逆転することのない違和感のないデータを得ることができる。次に、前記入力データが前方予測符号化画像ピクチャである場合、前記符号置き換え処理手段は、前記置き換えるあらかじめ用意された短い符号とし、時系列上、前方でもっとも近いフレーム内符号化画像ピクチャか、前方でもっとも近い前方予測符号化画像ピクチヤのうちのいずれかと同じデコード結果が得られるデータを選択し、前記入力データである前方予測符号化画像ピクチヤに後続する前方予測符号化画像ピクチャは、前記選択された前方の画像ピクチャを参照することが好ましい。上記構成により、置き換える必要のある前方予測符号化画像ピクチャを、近接する前方の画像ピクチヤであって、所定の符号発生量に収まつた画像データと置き換えることができ、動画像としてデコードした場合の違和感のないデータを得ることができる。また、置き換えた前方予測符号化画像ピクチャに後続する前方予測符号化画像ピクチャの参照処理では前記前方の画像ピクチャを参照するので、置き換え処理をした前方予測符号化画像ピクチャが他の画像ピクチヤの参照処理に利用されることがなく、不具合が発生することがない。

図面の簡単な説明第 1図は、本発明の実施形態の M P E Gェンコ一ド装置のプロック図である。

第 2図は、第 1図のエンコーダ部 1 0 6の詳細を示すプロック図である。

第 3図は、制御部 1 0 7の処理動作のフローチャートである。

第 4図は、外部メモリ 1 0 1にデータが書き込まれる様子を示した図である。

第 5図は、置き換えパターン 1を説明する図である。

第 6図は、置き換えパターン 2を説明する図である。

第 7図は、別の置き換えパターン 2を説明する図である。

第 8図は、置き換えパターン 3を説明する図である。発明を実施するための最良の形態

本発明の可変長符号化装置を M P E Gエンコーダに適応した実施形態を示す。

図 1は本実施形態にかかる M P E Gエンコーダのブロック図である。図 1に示すように外部メモリ 1 0 1 とエンコーダ 1 0 2とで構成されている。

エンコーダ 1 0 2はさらに外部メモリインターフェース 1 0 3、画像入力インターフェース 1 0 4、コード出力インターフェース 1 0 5、ェンコード部 1 0 6、制御部 1 0 7とで構成されている。

エンコード部 1 0 6が可変長符号化手段に該当し、外部メモリ 1 0 1 がバッファリング手段に該当し、後述するように制御部 1 0 7の制御により符号置き換え処理手段が実行される。また、本実施形態では処理単位は、画像ピクチャであり、ピクチャタイプは I ピクチャ（フ I /一ム内圧縮符号化画像）、 Pピクチャ（前方予測符号化画像）、 Bピクチャ（双方向予測符号化画像）がある。

外部メモリ 1 0 1は、参照画像データの保持やェンコ一ド処理されたビットストリームを一定ビットレートで出力するための緩衝用バッファとしての役割などを果たす。

外部メモリインターフェース 1 0 3は、画像入カインターフェイス 1 0 4、コード出力インタフェース 1 0 5、エンコード部 1 0 6 とレ、ぅ複数ブロックからの書き込み、読み出しの要求を調停し、他のブロックと外部メモリとのデータの入出力を実行する。

画像入カインターフェース 1 0 4は、外部からの入力画像 1 1 0を受け入れ、フィルタリングなどを行なった後、外部メモリインターフエ一ス 1 0 3を介して入力画像データ 1 1 0を外部メモリ 1 0 1の所定のァドレスに書き込む。以下、書き込みを行なった画像データをソース画像データと呼ぶことにする。

ェンコ一ド部 1 0 6は外部メモリ 1 0 1から画像データを読み込み、エンコード処理を実行し、エンコードしたデータを外部メモリ 1 0 1に書き込む。この際、後述するようにエンコードしたデータの符号発生量が設定した上限値以上であると制御部 1 0 7が判断すれば置き換え処理が実行され、置き換え後のデータが外部メモリ 1 0 1に書き込まれる。詳しい動作は後述する。

ここで、ライトポインタ 1 2 1は、書き込んだデータの外部メモリ 1 0 1上のァドレスを示すためのポィンタであり、ェンコ一ド処理において発生した符号量分だけライトポインタ 1 2 1は増加することとなる。また、後述するようにェンコ一ド処理開始前のライトポインタ 1 2 1は制御部 1 0 7のベースボインタ 1 2 4に渡され、また、ェンコ一ド処理後のライトポィンタ 1 2 1 も制御部 1 0 7に渡され、外部メモリ 1 0 1 に書き込まれたデータの発生符号量が上限値を越えているか否かの判断に利用される。

制御部 1 0 7は、エンコード部 1 0 6、コード出カインターフェース 1 0 5を制御し、また直接外部メモリインターフェース 1 0 3を通じて外部メモリ 1 0 1に対してデータ入出力を行う。設定する発生符号量の上限値を上限値記憶領域 1 2 5に保持し、エンコード部 1 0 6によるェンコード処理後の発生符号量が設定上限値を越えているか否かによる置き換え処理実行要否の判断を行い、越えている場合は、画像データのピクチャタイプ、時系列上の並びを考慮した置き換えパターンに従って置き換え処理を実行する。なお、設定上限値はピクチャタイプに合わせて設定することができ、 Bピクチャタイプ画像データの上限値がひ 1、 P ピクチャタイプ画像データの上限値が α 2である。ベースポインタ 1 2 4は、ェンコ一ド処理実行前のェンコ一ド部 1 0 6のライトポインタ 1 2 1の初期値を受け取り、記憶するものである。エンコード処理後のライトポインタ 1 2 1 との差によりエンコード処理による発生符号量算出に用いる。詳しい処理動作は後述する。

コード出力インターフェース 1 0 5は、内部にリードポインタ 1 2 2、ベースボインタ 1 2 3を保有し、このボインタを比較しながら外部の要求に応じて出力ビットストリーム 1 1 1を出力する。ここで、リ一ドボインタ 1 2 2はビットストリームの出力が済んでいる外部メモリ 1 0 1 のァドレスを記憶するためのボインタであり、ベースボインタ 1 2 2は、エンコード処理、置き換え処理が済み、出力可能となったデータの外部メモリ 1 0 1のァドレスを記憶するためのポィンタである。出力処理についての詳しい動作は後述する。

以下、エンコード部 1 0 6の構成を述べ、続いて、置き換え要否判断処理、置き換えパターン判別処理、置き換え処理、コード出力インタフエース 1 0 5を介した出力処理などについて詳しく説明する。まず、エンコード部 1 0 6の構成を説明する。図 2に示すように、ェンコード部 1 0 6は、外部メモリ 1 0 1 との間で処理画像データを読み書きするためのァドレスを生成するァドレス生成部 2 2 1を備えている。了ドレス生成部 2 2 1は、前述したライトポインタ 1 2 1を保持している。エンコード部 1 0 6はさらに動き検出部 2 0 2、差分画像生成部 2 1 3、 D C T部 2 0 6、量子化部 2 0 7、可変長符号化部 2 0 8、逆量子化部 2 0 9、逆 D C T部 2 1 0、動き補償部 2 1 1を備えている。マクロブロックデータ 2 0 1は 1 6 X 1 6画素のマクロブロックデータである。

動き検出部 2 0 2は、外部メモリ 1 0 1から読み出した参照画像データ 2 1 2を探索領域として、参照画像データ 2 1 2中の 1 6 X 1 6画素のブロックデータと処理対象のマックロブ口ックデータ 2 0 1 との比較を試行してもつとも合致するプロックデータを求める。そしてマクロブ口ックデータ 2 0 1 と求めたブロックデータの位置の差をべクトル表現したものを動きベクトル 2 1 7として差分画像生成部 2 1 3へ出力する。差分画像生成部 2 1 3は、与えられた動きべクトル 2 1 7を基に、外部メモリ 1 0 1に記憶されている参照用画像データ 2 1 2のうち入力されたマクロブ口ックデータ 2 0 1に対応する画像データから予測画像 2 1 9を生成する。差分画像生成部 2 1 3は、インター圧縮時では、マクロブ口ックデータ 2 0 1 と予測画像 2 1 9との差分を差分画像 2 0 4として出力し、イントラ圧縮時では実際には差分を取らずにマクロプロックデータ 2 0 1 と同一のデータを差分画像 2 0 4として出力する。ここで、差分画像生成部 2 1 3は、処理モードがインターモードであつたのかィントラモードであったのかを判別する情報と動きべクトル 2 1 7とをモード情報 2 0 5として出力する。

D C T処理部 2 0 6は、差分画像 2 0 4に対して直交変換である離散コサイン変換を行ない、その結果を出力する。

量子化部 2 0 7は、 D C T処理部 2 0 6の出力に対して量子化を行ない、その結果を量子化データ 2 1 6として出力する。この量子化により D C T処理結果の高周波成分が除去されてデータ量が圧縮される。

可変長符号化部 2 0 8は、モード情報 2 0 5とデータの出現確率に基づいて量子化データ 2 1 6を可変長符号化して出力ビットストリーム 2 1 4として出力する。ここで動きべクトル 2 1 7を含むモード情報 2 0 5は出力ビットストリーム 2 1 4の一部に符号化される。後述する制御部 1 0 7での置き換え要否判断において可変長符号化したデータの発生符号量が設定した上限値 α 1または α 2を越えていると判断された場合には、制御部 1 0 7による置き換え処理が実行され、制御部 1 0 7が発行する置き換えパターン信号 2 3 0に従い、保持している置き換えパターン保持部 2 3 1が保持する置き換えパターンと置き換えられ、置き換え後のデータを出力ビットストリーム 2 1 4として出力する。

エンコード部 1 0 6は、上記出力ビットストリーム 2 1 4生成とともに次のェンコ一ド処理のために参照用フレーム画像データ 2 2 0を生成すべく、デコーダで行われるデコード処理と同様の処理を逆量子化部 2 0 9、逆0〇丁部2 1 0、動き補償部 2 1 1により行いデータを用意する。

逆量子化部 2 0 9は量子化データ 2 1 6を逆量子化する。ここで量子化の逆変換に相当するが量子化において情報量が減少しているために D C T部 2 0 6の出力と逆量子化部 2 0 9の出力とは一致しない。

逆 D C Τ部 2 1 0は逆量子化部 2 0 9の出力に対して逆 D C T処理を行なう。

動き補償部 2 1 1は、モード情報 2 0 5や予測画像 2 1 9を基に動き補償を行なう。動き補償は、モード情報 2 0 5がイントラモードの場合には逆 D C T部 2 1 0の結果をそのまま出力し、モード情報 2 0 5がィンターモードの場合には予測画像 2 1 9 と逆 D C Τ部 2 1 0の出力を加算したものを出力する。これは差分画像生成部 2 1 3の逆の動作に相当する。動き補償部 2 1 1の出力は参照画像データ 2 2 0としてァドレス生成部 2 2 1に送られ、外部メモリインタフェース 1 0 3を介して外部メモリ 1 0 1に書き込まれ、次段のマクロブロックデータ 2 0 1のェンコード処理に使用される。

以上のように、エンコード部 1 0 6は、ソース画像データをェンコ一ドし、必要に応じて置き換え処理されたビットストリームを作成し、その結果を外部メモリ 1 0 1に書き込む動作を行なう。

なお、 M P E Gではェンコ一ド処理の中で動き補償について入力フレーム画像のピクチャコ一ディングタイプに応じて異なった処理が行われる。ェンコ一ド部 1 0 6は、制御部 1 0 7に指定される 3種類のピクチヤコーデイングタイプ（ I ピクチャ、 Pピクチャ、 Bピクチャ）の種類に応じて動き検出部 2 0 2や動き補償部 2 1 2の動作を変更する。

I ピクチャの場合にはフレーム間の情報、参照画像を利用せず、動き補償、動き検出などを行なわずにエンコードし、ローカルデコード画像を外部メモリ 1 0 1に対して書き込む。即ち、動き検出部 2 0 2は動きべクトル 2 1 7を出力せず、差分画像生成部 2 1 3は、参照画像 2 1 2 を利用せず常にイントラ（動き補償を行なわない）モードで動作する。

Pピクチャの場合には時系列上で前方にある参照フレーム画像を 1つのみ利用してその参照画像に対する動き予測を利用してエンコードし、ローカルデコード画像を外部メモリ 1 0 1に対して書き込む。

Bピクチャの場合には時系列上で近隣の 2つの参照フレーム、例えば前後の I ピクチャまたは Pピクチャの 2フレームを参照画像として用いる。このタイプに関してはローカルデコード画像を外部メモリ 1 0 1に書き込まない。すなわち、アドレス生成部 2 2 1は、参照画像データ 2 2 0を外部メモリ 1 0 1に書き込む動作を行なわない。 Bピクチャタイプの画像は参照画像として用いられることはないためローカルデコード画像を保持しておく必要がないためである。逆にいうと Bピクチャタイプに対してのデータ変更操作は他のフレーム画像に対して影響を全く与えないことがわかる。一方、 I タイプ、 Pタイプのデータ変更操作は他のフレームの画像に影響を与える。

以上が、エンコード部 1 0 6の構成である。

次に、本実施形態にかかる可変長符号化装置を利用した MP EGェンコード処理手順を説明する。図 3は、制御部 1 0 7の処理動作を中心とした本発明の可変長符号化装置の処理フローである。図 4は外部メモリ 1 0 1にデータが書き込まれる様子を示した図である。

入力画像 1 1 0はー且、画像入カインターフェース部 1 04を通じて外部メモリ 1 0 1にソース画像として書き込まれる。この動作は他のブ口ックから独立して動作する。以下、既に外部メモリ 1 0 1にソース画像が取り込まれているものとして説明する。

最初に、制御部 1 0 7は初期化処理（ステップ 3 0 1 ) を実行する。初期化処理では、エンコード部 1 0 6のライトポインタ 1 2 1、コード出力インターフェース 1 0 5のリードポインタ 1 2 2、ベースポィンタ 1 2 3、制御部 1 0 7が保持するベースボインタ 1 24がそれぞれ 0に

BX疋 2·れる。

次にピクチャタイプの決定（ステップ 3 0 2) が実行される。ピクチャタイプのシーケンスは、 MP E Gではエンコーダ機器側が決めるものであり、制御部 1 0 7は、例えば Ι， Β， Β， Β, Ρ， Β， Β， Β， Ι， · · · という順番を繰り返すなどのピクチヤタイプのシーケンスを指定することができる。次に、エンコード部 1 0 6の起動処理（ステップ 3 0 3 ) が実行され、エンコード部 1 0 6の処理終了待ち（ステップ 3 0 4 ) に入る。ェンコード部 1 0 6の起動された時点では図 4 ( a ) に示すようにライトボインタ 1 2 1 とベースポィンタ 1 2 4は一致している。次に、エンコード部 1 0 6は、画像データを 1 ピクチャ分外部メモリ 1 0 1から取り込んでェンコ一ド処理を実行し、ェンコ一ド処理結果を外部メモリ 1 0 1へ書き込む。エンコード部 1 0 6のライトポインタ 1 2 1は描き込んだ符号量に従って増加していく（図 4 ( b ) )。このときコード出力インターフェイス 1 0 5のベースポィンタ 1 2 3の値は前のままであって、現在エンコード中のデータは外部へ出力されない。

次に、制御部 1 0 7は、エンコード部 1 0 6が 1 ピクチャ分のェンコード処理を終了すると、符号発生量計算処理（ステップ 3 0 5 ) を行なう。この符号発生量計算処理は、制御部 1 0 7がエンコード部 1 0 6のライトポインタ 1 2 1の値を読み出して制御部 1 0 7自身が保持していたベースボインタ 1 2 4と比較することにより行う。つまりライトボインタはェンコ一ド結果の書き込みの際に符号発生量に応じて増加しているのでボインタの増加分を計算することで符号発生量を算出することができる。

次に置き換え処理を実行するか否かの判断（置き換え要否判断）を行う（ステップ 3 0 6 )。ここでは、ステップ 3 0 5で計算した符号化ビット発生量が上限値を越えているか否かをチユックする。処理中の画像データのピクチャタイプが Bピクチャであれば、上限値 α 1 と比較し、処理中の画像データのピクチャタイプが Ρピクチャであれば、上限値ひ 2と比較する。符号発生量が上限値以内ならばステップ 3 0 9に進み、符号発生量が上限値を越える場合にはステップ 3 0 7の置き換え処理に進む。図 4 bに示した例では設定上限値（例えばひ 1 ) を越えている。ステップ 3 0 6で符号化ビット発生量が上限値を越えた場合は、置き換え処理（ステップ 3 0 7、ステップ 3 0 8 ) を実行する。まず、ステップ 3 0 7で、制御部 1 0 7のベースポィンタ 1 2 4をェンコ一ド部 1 0 6のライトポインタ 1 2 1に戻す。これにより、エンコード部 1 0 6 のライトポインタ 1 2 1はェンコ一ド結果書き込み前の元の値に戻る (図 4 ( c ) )。次いで、ステップ 3 0 8で、制御部 1 0 7は、処理中の画像データのピクチャタイプ、時系列上の画像データの位置に応じて置き換えパターンを判別し、この置き換えパターン信号 2 3 0をェンコ一ド部 1 0 6に与える。エンコード部 1 0 6は受け取った置き換えパターン信号 2 3 0に従い、置き換えパターン保持部 2 3 1が保持する置き換えパターンから指定されたデータをェンコ一ド処理済みデータとして採用し、外部メモリ 1 0 1に対して、元の値に戻されたライトポインタ 1 2 1が示すァドレスから上書きして行く。ライトポインタ 1 2 1の値は、上書きした置き換えデータの書き込み終了地点のァドレスまで更新される（図 4 ( d ) )。上書きされず残っているデータは無視され、次の画像データの処理は図 4 ( d ) のライトポインタの値から続行され、次の画像データ処理結果が書き込まれて行く。

置き換えパターン保持部 2 3 1が保持するデータは、

( 1 ) 全マクロプロックを前方予測モード、動きべクトル 0、差分データ 0で符号化したもの（前方の参照画像と同じデコード結果が得られるデータ）

( 2 ) 全マクロブロックを後方予測モード、動きベクトル 0、差分データ 0で符号化したもの（後方の参照画像と同じデコード結果が得られるデータ）

の 2種類である。

これらの短いデータは、決められたコードとして、ソース画像を必要とせずにあらかじめ準備しておくことができ、かつデータ量も非常に少なレ、。

なお上記の置き換えパターン判別処理についての詳細は後述する。次に、制御部 1 0 7は、出力処理のためのポインタ更新を行う（ステップ 3 0 9 )。まず、エンコード部のライトポィンタの値をベースポィンタ 1 2 4とコード出力部 1 0 5のベースポィンタ 1 2 3に代入する。コード出力インターフェイス 1 0 5を介した出力処理は以下の通りである。コード出力インターフェイス 1 0 5は、出力要求があつたとき、リ一ドボインタ 1 2 2がベースボインタ 1 2 3と一致するまで符号化ビットを読み出して出力ビットストリーム 1 1 1 として出力する。つまり、 ( 1 ) リードボインタ 1 2 2、ベースボインタ 1 2 3がー致していないときには、リードポインタ 1 2 2が指し示すァドレスのデータを外部メモリ 1 0 1から読み出し外部へ出力ビットストリーム 1 1 1 として出力する。そしてその後リ一ドボインタ 1 2 2の値は " 1 " 増加する。

( 2 ) リードポインタ 1 2 2とベースポインタ 1 2 3がー致しているときは外部に対し出力すべきデータがないことを知らせる。

コード出力インターフェース 1 0 5は以上のような動作をするのでベースポインタ 1 2 3を越えてリ一ドボインタ 1 2 2は増加せず、ベースボインタ以降のデータは外部へ出力されない。

以上の一連の処理の後、再ぴピクチャタイプの決定（ステップ 3 0 2 ) に処理が移行する。

なお、上記フローは制御部 1 0 7にマイクロコードを用いてプロダラムされている。

次に、置き換えパターン判別処理の詳細について述べる。置き換えパターンは何種類かのパターンが存在する。本実施形態では、処理対象の画像データのピクチャコ一ディングタイプと、時系列に並べた場合の当該画像の位置に応じてパターンを判別する。置き換えパターン判別において重要な点は以下の 2つのルールである。

( 1 ) 置き換えるデータは時間的に近接する参照画像と同じデコード結果が得られるものであること。これにより置き換え後の画像データの再生画像が前後の画像と時間的に近く、違和感の少ない再生画像となる。

( 2 ) 置き換え後の画像データの時系列の並びが前後の画像データと逆転していないこと。これにより置き換え後の画像データの再生画像が時間的に逆戻りすることがなく、違和感の少ない再生画像となる。

上記 2点に注目して、それぞれの置き換えパターンについて説明を行なう。

パターン 1は、ェンコ一ド処理を行った画像がピクチャコ一ディングタイプ Bで、前方の参照画像（ Iまたは Pピクチャ）の直後に相当する画像であって、かつ、その画像のエンコード結果である符号発生量が α 1を越えている場合である。このパターン 1は、当該 Βピクチャのェンコードデータを、前方の参照画像と同じデコード結果が得られるデータと置き換えるパターンである。図 5に一例を示す。図 5 ( a ) は時系列順に並べた置き換え処理前の画像データの様子を示し、図 5 ( b ) が置き換え処理後の動画表示の様子を示したものである。図 5 ( a ) に示すように、ピクチャシーケンスが I ， B， B， B， Pであり、それぞれの画像を順に a , b， c， d , e とする。パターン 1は、画像 bのェンコ一ドデータが符号発生量が α 1より大きい場合が該当する。

ここで、パターン 1の場合の置き換えパターン信号の生成と置き換え処理について述べる。エンコード処理の順は I 、 Ρ、 Βの順に行なわれるので a， e， b， c， dの順で行なわれる。画像 bのエンコード処理後、ステップ 3 0 6の制御部 1 0 7の置き換え要否判断で置き換えが必要と判断された場合、制御部 1 0 7はピクチャタイプが Bであり、かつ、前方の参照画像の直後にあるのでパターン 1 と判定でき、置き換えパターン保持部 2 3 1が保持している前方の参照画像と同じデコード結果が得られるデータを置き換えるデータとして指定する。このときデコード結果は画像 a と同一のものとなる。なお、ステップ 3 0 8の置き換え処理により、再生画像は a , a， c， d , e となる。つまり一瞬だけ画像 aが連続表示されるのみであり、見た目の違和感を少なくできる。

次に、パターン 2を説明する。パターン 2は、エンコード処理を行つた画像がピクチャコ一ディングタイプ Bで、その画像のェンコ一ド結果である符号発生量が ct 1を越えており、当該 Βピクチャのェンコ一ドデータを、後方の参照画像と同じデコード結果が得られるデータと置き換えるパターンである。特に処理対象である画像データの時系列上の並びが後方の参照画像側に近い場合や、前方の参照画像までの間にェンコ一ド処理が所定の発生符号量内に収まった他の画像データが存在する場合のパターンである。図 6に一例を示す。図 6 ( a ) は時系列順に並べた置き換え処理前の画像データの様子を示し、図 6 ( b ) が置き換え処理後の動画表示の様子を示したものである。図 6 ( a ) に示すように、ピクチャシーケンスが I， B， B， B， Pであり、それぞれの画像を順に a , b , c， d， e とする。パターン 2は、画像 cや画像 dのェンコ一ドデータが符号発生量が α 1 より大きい場合が該当する。ここでは画像 cが符号発生量が α 1 より大きい場合とする。

パターン 2の場合の置き換えパターン信号の生成と置き換え処理について述べる。パターン 1の場合の説明と同様、ェンコ一ド処理の順は I、 Ρ、 Βの順に行なわれるので a， e , b， c， dの順で行なわれ、画像 cのェンコ一ド処理後、ステップ 3 0 6の制御部 1 0 7の置き換え要否判断で置き換えが必要と判断されると、制御部 1 0 7はピクチャタイプが Bであり、かつ、先行する参照画像 a との間に他の画像 bがあるのでパターン 2と判定し、置き換えパターン信号 " 2 " を発行し、置き換えパターン保持部 2 3 1が保持している後方の参照画像と同じデコード結果が得られるデータを置き換えるデータとして指定する。この置き換えパターン 2はピクチャシーケンス上、後方の参照画像 eまでのすベての画像に対して、後方の参照画像と同じデコード結果が得られるデータとの置き換えを指定し、置き換えたデータをエンコードデータとする。そのため、ステップ 3 0 8の置き換え処理により、図 6 ( b ) に示すように、再生画像は a， b , e， e， e となる。つまり一瞬だけ画像 eが連続表示されるのみであり、見た目の違和感を少なくできる。

なお、このパターン 2では、以下の通り、別の置き換え処理を規定することができる。この別の置き換えパターン 2を図 7を用いて説明する。上記の置き換えパターン 2と同様、エンコード処理が I、 P、 Bの順に行なわれ、 a， e， b , c， dの順で行なわれる。置き換えパターン保持部 2 3 1は、符号発生量が上限値ひ 1を越える画像データが出現するまで、 Bピクチャの画像をのエンコード結果を第 3の置き換えパターンとして更新しながら処理を進める。ここでは、画像 cに対する符号発生量が α 1を越えるものとする。画像 cのエンコード処理後、ステップ 3 0 6の制御部 1 0 7の置き換え要否判断において置き換えが必要と判断され、制御部 1 0 7はピクチャタイプが Βであり、かつ、先行する参照画像 a との間に他の画像 bがあるのでパターン 2と判定し、置き換えパターン信号 " 3 " を発行する。ここで、パターン信号 " 3 " は第 3の置き換えパターン、つまり直前の Bピクチャである画像 bのエンコードデータを置き換えるデータとして指定する。そのため、ステップ 3 0 8の置き換え処理により、図 7 ( b ) に示すように、再生画像は a， b， b， d， e となる。

置き換えるビットストリームは、画像 bに対する Bピクチャデータと同様であり、画像 Cの処理では、全てのマクロブロックにおいて画像 b と同じ双方向予測を行い、画像処理を実行する。置き換えるデータは直前の Bピクチャのェンコ一ドデータであり、あらかじめ用意しておくことが可能であり、データ作成は非常に高速であってリアルタイム処理が実現可能である。さらにデコードした結果は前方の画像 bと同じ画像になる。つまり一瞬だけ画像 bが連続表示されるのみであり、見た目の違和感を少なくできる。

なお、上記の別のパターン 2では、先行した Bピクチャの画像 bのェンコードデータを第 3の置き換えパターンとして置き換えパターン保持部 2 3 1に保持したが、制御部 1 0 7は、先行した Bピクチャ画像 bのェンコ一ドデータを描き込んだァドレスを別に保持しておく構成でも良レ、。つまり、続く Bピクチャ画像 cのエンコード結果の符号化ビット発生量がひ 1を越えた場合、制御部 1 0 7が別に保持していたァドレスに格納されているェンコ一ドデータを画像 cのェンコ一ドデータとして続くアドレスにコピーする。さらに次の Bピクチャの符号発生量も大きければ同様に続くァドレスにコピーする。また置き換え処理が必要となる Bピクチャ画像が連続するときはまとめて連続するァドレスに画像 bのェンコ一ドデータをコピーしても良い。この別のパターン 2の置き換え処理によっても連続する Bピクチャの符号化ビット発生量はすべて上限値ひ 1以内となり、置き換えた Bピクチャ分だけ一瞬、同じ画像が連続表示されるのみであり、見た目の違和感を少なくできる。

次に、パターン 3を説明する。パターン 3は、エンコード処理を行つた画像がピクチャコ一ディングタイプ Pで、その画像のェンコ一ド結果である符号発生量が α 2を越えており、当該 Ρピクチャのェンコ一ドデータを、前方の参照画像と同じデコード結果が得られるデータと置き換えるパターンである。このパターン 3では置き換えられた Ρピクチャは他の画像データの参照処理には用いられないように、当該 Pピクチャに続く Pピクチャは置き換えた前方の参照画像を参照する。図 8に一例を示す。図 8 ( a ) は時系列順に並べた置き換え処理前の画像データの様子を示し、図 8 ( b ) が置き換え処理後の動画表示の様子を示したものである。図 8 ( a ) に示すように、ピクチャシーケンスが I， B， B , P， Pであり、それぞれの画像を順に a， b , c， d , eとする。パターン 3は、 Pピクチャタイプである画像 dのェンコ一ドデータが符号発生量が ο; 2より大きい場合が該当する。

パターン 3の場合の置き換えパターン信号の生成と置き換え処理について述べる。パターン 1の場合の説明と同様、ェンコ一ド処理の順は I、 Ρ、 Βの順に行なわれるので a， d , e , b， c，の順で行なわれる。画像 dのェンコ一ド処理後、ステップ 3 0 6の制御部 1 0 7の置き換え要否判断で置き換えが必要と判断されると、制御部 1 0 7はピクチャタイブが Pであるのでパターン 3と判定し、置き換えパターン信号 " 1 " を発行し、前方参照画像と同じデコード結果が得られるデータを置き換えるデータとして指定する。この置き換えパターン 3はピクチャシーケンス上、参照画像 dまでのすベての画像に対して前方の参照画像と同じデコード結果が得られるデータとの置き換えを指定し、置き換えたデータをエンコードデータとする。そのため、ステップ 3 0 8の置き換え処理により、図 8 ( b ) に示すように、再生画像は a， a , a , a , eとなる。なお、後続する Pピクチヤである画像データ eは、前方参照画像として元来画像データ dを参照するものであるが、画像データ dが画像データ aと同じデコード結果が得られるデータに置き換えられているため、結局画像 aを前方の参照画像として用いることとなる。

置き換えるビットストリ一ムはパターン 1 と同様に、全てのマクロブロックにおいて前方の参照画像 aから動きべクトル 0で予測を行ない、しかも予測と実際の画像との差分が " 0 " であるというデータである。つまり図 2において動きべクトル 2 1 7を " 0 " に、モード情報 2 0 5 をィンターモードでかつ前方予測に、さらに差分画像 2 0 4を全て " 0 " とするものに対応し、よって、 D C T結果は全て " 0 "、量子化結果は全て " 0 " であって、可変長符号化部 2 0 8は全て " 0 " のデータに対して符号化を行なったものに相当する。従って入力画像や参照画像に全く依存しないコードであるため、あらかじめ用意しておくことが可能であるため、データ作成は非常に高速であってリアルタイム処理が実現可能である。さらにデコードした結果は前方の参照画像 a と同じ画像になる。つまり一瞬だけ画像 aが連続表示されるのみであり、見た目の違和感を少なくできる。

以上 3つの置き換えパターンとその置き換え処理を説明した。これらの方法は任意に組み合わせることができ、柔軟に符号発生量を制御できる。

上記置き換え処理を行なった場合に出力される出力ビットストリーム 1 1 1は置き換えられた画像のデコード結果がそのごく近くの画像のデコード結果と同じになる。つまりこれら置き換え処理はデコード結果がいずれも時間的に非常に近接した画像に置き替わるだけであり、また時間的に画像の順番が逆転することがないように制御されている。よってその付近で画像が一瞬フリーズされるように感じるがプロックが大幅に乱れるようなことはなく見ための違和感が少なくなる。また置き換えるビットストリームは、ソース画像データからェンコ一ドするものではなくあらかじめ用意されているものであって、書き込みは非常に高速に行なうことができリアルタイム処理でデータの置き換えが実現できる。従つてデコードしたときの違和感を最小限にとどめ、かつ符号化ビット発生量が確実に制御できる。なお、本実施形態は全てピクチャ単位（フレーム構造ではフレーム、フィールド構造ではフィールド）の置き換え処理を前提とした説明としたが、より大きい範囲や小さい範囲でも適用することは可能であり符号化ビット発生量の制御として効果がある。ただし適用範囲境界での整合性を図り、見た目の違和感を小さくすることが好ましい。

また、図 3に示した処理フローは制御部 1 0 7にマイクロコードを用いてプログラムされており、柔軟なシステム設計が可能である。

また、上記実施形態では、図 3の処理フローのステップ 3 0 6の置き換え要否判断において、上限値をしきい値として用いて、符号発生量と比較して置き換え処理の要不要を判断する例としたが、置き換え処理実行か否かの判断処理の方法は、符号発生量と設定した上限値の比較方法に限られない。例えば、量子化ステップ、平均輝度の値を勘案したしきい値を設定し、そのしきい値と量子化ステップ、平均輝度を比較して置き換え処理の要不要を判断する構成としても良い。

なお、本発明の可変長符号化装置は、上記の発明の概念から逸脱することなく、上記の方法及び装置に種々の変更及び変形を成し得ることが理解されよう。従って、本発明は上記実施形態に限定されるものではないことに注意する必要がある。

産業上の利用可能性

本発明の可変長符号化装置によれば、リアルタイム処理で符号化ビット発生量の上限を確実に制御でき、符号発生量を制御してレートコントロールが実現できる。データの置き換え処理は非常に高速に行なうことができ、かつ、置き換え処理を行ったデータのデコード結果は近接する画像と同じであり、見た目の違和感がない。さらにデータ量を確実に制御できるためレートコントロールの破綻を心配することなく量子化ステップを小さくできるので通常の画像の高画質化を図ることができる。また、本発明の可変長符号化装置によれば、エンコード機器側のェンコード処理で符号発生量を制御したェンコ一ドデータを生成するので、デコード機器側で特別な構成、仕組みを必要とせず、規格に対応したどんなデコード機器であっても符号発生量を制御したデータのデコードができ、動画像を生成できる。

Claims

請求の範囲

1 . 入力されたデータを処理単位毎に可変長符号化する可変長符号化手段と、前記可変長符号化された可変長符号化データを一時的に記憶するバッファリング手段と、前記バッファリング手段に記憶された可変長符号化データの処理単位当たりの符号発生量に応じて、あらかじめ用意された前記符号発生量より短い符号に置き換える符号置き換え処理手段を具備することを特徴とする可変長符号化装置。

2 . 前記入力データの処理単位当たりの符号発生量の上限値を設定する手段を備え、前記符号置き換え処理手段が、前記バッファリング手段に記憶された可変長符号化データの処理単位当たりの符号発生量が前記上限値を越えた場合にあらかじめ用意された短い符号に置き換える処理をする手段と、前記バッファリング手段に記憶された可変長符号化データの処理単位当たりの符号発生量が前記上限値を越えない場合に符号の置き換えを行わない処理をする手段とを備えた請求項 1に記載の可変長符号化装置。

3 . 前記入力は動画像データのフレーム内圧縮処理またはフレーム間圧縮処理されたデータであって、前記処理単位は、動画像データの 1 ピクチャ当たりのデータである請求項 1または 2に記載の可変長符号化装

4 . 前記符号置き換え処理手段が置き換えるあらかじめ用意された短い符号を、すでに前記符号置き換え処理手段による処理が済んだ処理単位にかかる置き換え処理済データと同じデコード結果が得られるものとする請求項 1〜 3いずれか 1項に記載の可変長符号化装置。

5 . 前記入力データが双方向予測符号化画像ピクチヤである場合、前記符号置き換え処理手段は、前記置き換えるあらかじめ用意された短い符号とし、時系列上、前方でもっとも近いフレーム内符号化画像ピクチャか、前方でもっとも近い前方予測符号化画像ピクチャか、後方でもつとも近いフレーム内符号化画像ピクチャか、後方でもつとも近い前方予測符号化画像ピクチヤのうちのいずれかと同じデコード結果が得られるデータを選択する請求項 4に記載の可変長符号化装置。

6 . 前記選択において後方の画像ピクチャを選んだ場合は、前記入力データから前記選択した後方の画像ピクチヤまでの間にある双方向予測符号化画像ピクチャすベてを前記選択した後方の画像ピクチャと同じデコード結果が得られるデータと置き換える請求項 5に記載の可変長符号化装置。

7 . 前記入力データが前方予測符号化画像ピクチャである場合、前記符号置き換え処理手段は、前記置き換えるあらかじめ用意された短い符号とし、時系列上、前方でもっとも近いフレーム内符号化画像ピクチャか、前方でもっとも近い前方予測符号化画像ピクチャのうちのいずれかと同じデコード結果が得られるデータを選択し、前記入力データである前方予測符号化画像ピクチヤに後続する前方予測符号化画像ピクチャは、前記選択された前方の画像ピクチャを参照する請求項 4に記載の可変長符号化装置。