WO1998020483A1 - Generateur de vecteur de source sonore, codeur et decodeur vocal - Google Patents

Generateur de vecteur de source sonore, codeur et decodeur vocal Download PDF

Info

Publication number
WO1998020483A1
WO1998020483A1 PCT/JP1997/004033 JP9704033W WO9820483A1 WO 1998020483 A1 WO1998020483 A1 WO 1998020483A1 JP 9704033 W JP9704033 W JP 9704033W WO 9820483 A1 WO9820483 A1 WO 9820483A1
Authority
WO
WIPO (PCT)
Prior art keywords
vector
noise
spectrum
sound source
fixed
Prior art date
Application number
PCT/JP1997/004033
Other languages
English (en)
French (fr)
Inventor
Kazutoshi Yasunaga
Toshiyuki Morii
Taisuke Watanabe
Hiroyuki Ehara
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27459954&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=WO1998020483(A1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from JP29473896A external-priority patent/JP4003240B2/ja
Priority claimed from JP31032496A external-priority patent/JP4006770B2/ja
Priority claimed from JP03458397A external-priority patent/JP3700310B2/ja
Priority claimed from JP03458297A external-priority patent/JP3174742B2/ja
Priority to DE69730316T priority Critical patent/DE69730316T2/de
Priority to AU48842/97A priority patent/AU4884297A/en
Priority to US09/101,186 priority patent/US6453288B1/en
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to EP97911460A priority patent/EP0883107B9/en
Priority to KR10-2003-7012052A priority patent/KR20040000406A/ko
Priority to CA002242345A priority patent/CA2242345C/en
Priority to KR1019980705215A priority patent/KR100306817B1/ko
Priority to EP99126132A priority patent/EP0991054B1/en
Publication of WO1998020483A1 publication Critical patent/WO1998020483A1/ja
Priority to HK99102382A priority patent/HK1017472A1/xx
Priority to US09/440,083 priority patent/US6421639B1/en
Priority to US09/843,939 priority patent/US6947889B2/en
Priority to US09/849,398 priority patent/US7289952B2/en
Priority to US11/126,171 priority patent/US7587316B2/en
Priority to US11/421,932 priority patent/US7398205B2/en
Priority to US11/508,852 priority patent/US20070100613A1/en
Priority to US12/134,256 priority patent/US7809557B2/en
Priority to US12/198,734 priority patent/US20090012781A1/en
Priority to US12/781,049 priority patent/US8036887B2/en
Priority to US12/870,122 priority patent/US8086450B2/en
Priority to US13/302,677 priority patent/US8370137B2/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

明 細 書 音源べク卜ル生成装置並びに音声符号化装置及び音声復号化装置 技術分野
本発明は、 品質の高い合成音声を得ることのできる音源べクトル生成装置、 並びに低ビットレートで高品質の音声信号を符号化 Z復号化することのできる 音声符号化装置及び音声複号化装置に関する。 背景技術
CELP (Code Excited Linear Prediction) 型の音声符号化装置は、 音声 を一定時間で区切ったフレーム毎に線形予測を行い、 フレーム毎の線形予測に よる予測残差 (励振信号) を、 過去の駆動音源を格納した適応符号帳と複数の 雑音符号べクトルを格納した雑音符号帳を用いて符号化する方式である。 例え ば、 "High Quality Speech at Low Bit Rate", M. R. Schroeder, Pro I CAS SP'85, pp.937-940 に C E L P型の音声符号化装置が開示されている。
図 1に、 CEL P型の音声符号化装置の概略構成が示されている。 CELP 型の音声符号化装置は、 音声情報を音源情報と声道情報とに分離して符号化す る。 声道情報については、 入力音声信号 10をフィル夕係数分析部 1 1に入力 して線形予測し、 線形予測係数 (LPC) をフィル夕係数量子化部 12で符号 化する。 線形予測係数を合成フィルタ 13へ与えることにより合成フィル夕 1 3で声道情報を音源情報に加味できる。 音源情報については、 フレームを更に 細かく分けた区間 (サブフレームと呼ばれる) 毎に適応符号帳 14と雑音符号 帳 15の音源探索が行われる。 適応符号帳 14の探索と雑音符号帳 15の探索 は、 (数式 1) の符号化歪みを最小化する適応符号ベクトルのコード番号とそ のゲイン (ピッチゲイン) 、 および雑音符号ベクトルのコード番号とそのゲイ ン (雑音符号ゲイン) を決定する処理である。
l|v - (gaHp + gcHc)\\2 ( i ) v :音声信号 (べクトル)
H :合成フィル夕のインパルス応答畳み込み行列 h(0) 0 0 0
h(l) h(0) 0 … 0 0
h(2) h l) 議 0 0 0
H
0 0
Λ(0) 0
h(L - 1) h(l) h(0) 但し、 h :合成フィル夕のインパルス応答(ベクトル)
L :はフレーム長
p : 適応符号べクトル
c : 雑音符号ベクトル
S° :適応符号ゲイン(ピッチゲイン)
:雑音符号ゲイン
しかし、 (数式 1 ) を最小とする上記符号を閉ループ探索すると、 符号探索 に要する演算量が膨大になるため、 一般的な C E L P型音声符号化装置では、 まず適応符号帳探索を行い、 適応コードベクトルのコード番号を特定され、 次 にその結果を受けて雑音符号帳探索を行い雑音コ一ドべクトルのコ一ド番号を 特定される。
ここで、 C E L P型音声符号化装置の雑音符号帳探索について、 図 2 A〜図 2 Cを用いて説明する。 図中、 符号 Xは (数式 2 ) によって求めた雑音符号帳 探索用の夕ーゲットべクトルである。 適応符号帳探索はすでに終了しているも のとする。 x = v - gaHp ( 2 ) x :雑音符号帳探索夕一ゲット(べクトル)
V :音声信号 (べクトル)
H :合成フィル夕のインパルス応答畳み込み行列
P : 適応符号べクトル
ga :適応符号ゲイン(ピッチゲイン)
雑音符号帳探索は、 図 2 Aに示すように歪み計算部 1 6において (数式 3 ) で定義される符号化歪を最小化するような雑音符号べクトル cを特定する処理 である。
II -
Figure imgf000005_0001
( 3 )
X :雑音符号帳探索夕ーゲッ卜(べクトル)
:合成フィル夕のインパルス応答畳み込み行列
: 雑音符号べクトル
:雑音符号ゲイン
歪み計算部 1 6は、 雑音符号ベクトル cを特定するまで制御スィッチ 2 1を 制御して雑音符号帳 1 5から読み出される雑音コードべクトルを切替える。 実際の C E L P型音声符号化装置は、 計算コストを削減するために図 2 Bの 構成になっており、 歪み計算部 1 6 ' では (数式 4 ) の歪み評価値を最大化す るコード番号を特定する処理が行われる。
{x' cf ((x'H)c)2 (x"cf (x"cf ( 4 )
||Hc||2 _ ||Hc||2 ||Hc||2 c'H'Hc
X :雑音符号帳探索ターゲット(べクトル)
H :合成フィル夕のインパルス応答畳み込み行列
H' : Hの転置行列
x' : X を Hで時間逆順合成化合成逆順化したべクトル ( " = x' ) c : 雑音符号べクトル
具体的には、 雑音符号帳制御スィッチ 2 1が雑音符号帳 1 5のある 1端子に 接続され、 その端子に対応したアドレスから雑音コードべクトル cが読み出さ れる。 読み出された雑音コードベクトル cが合成フィル夕 1 3によって声道情 報と合成され、 合成ベクトル H eが生成される。 次に、 ターゲット Xを時間逆 順化、 合成、 時間逆順化して得られたベクトル x ' と、 雑音コードベクトルを 合成フィル夕で合成したべクトル H eと、 雑音コードべクトル cとを用いて、 歪み計算部 1 6 ' が (数式 4 ) の歪み評価値を算出する。 そして、 雑音符号帳 制御スィッチ 2 1を切替えることで、 上記歪み評価値の雑音符号帳内の全ての 雑音べクトルについて算出していく。
最終的に、 (数式 4 ) の歪み評価値が最大になるときに接続していた雑音符 号帳制御スィッチ 2 1の番号が、 雑音コードベクトルのコード番号として符号 出力部 1 7へ出力される。
図 2 Cに音声復号化装置の部分的な構成を示している。 伝送されてきたコー ド番号の雑音コードべクトルが読み出されるように雑音符号帳制御スィツチ 2 1が切替え制御される。 また、 伝送されてきた雑音符号ゲイン g c及びフィル 夕係数を増幅回路 2 3及び合成フィル夕 2 4に設定してから、 雑音コードべク トルを読み出して合成音声を復元する。
上述した音声符号化装置 復号化装置においては、 雑音符号帳 1 5に音源情 報として格納される雑音符号べクトルの数が多いほど、 実音声の音源に近似し た雑音符号ベクトルを探索できることになる。 しかし、 雑音符号帳 (R OM) の容量には制限があるため全ての音源に対応した無数の雑音符号べクトルを雑 音符号帳に格納しておくことはできない。 このため音声品質の向上を図る上で 限界があった。
また、 歪み計算部における符号化歪みの計算コストを大幅削減でき、 且つ雑 音符号帳 (R OM) を削減可能にした代数的構造音源が提案されている ("8KB IT/S ACELP CODING OF SPEECH WITH 10 MS SPEECH-FRAME: A CANDIDATE FOR C CITT STANDARDIZATION": R. Salami, C. Laflamme, J-P. Adoul, ICASSP' 94, pp. I I- 97〜I I- 100, 1994に記載) 。
代数的構造音源は、 合成フィルタのインパスル応答と時間逆順化したターゲ ッ 卜との畳み込み演算結果及び合成フィルタの自己相関を予め計算してメモリ に展開しておくことで、符号化歪み計算のコストを大幅に削減している。また、 代数的に雑音符号べク トルを生成することにより雑音符号べク トルを格納して いた R OMを削減している。 上記代数的構造音源を雑音符号帳に使用した C S — A C E L P及び A C E L P力 I T U— Tからそれぞれ G . 7 2 9及び G . 7 2 3 . 1 として勧告されている。
しかしながら、 上記代数的構造音源を雑音符号帳部に備えた C E L P型の音 声符号化装置/音声複号化装置では、 雑音符号帳探索用ターゲットを、 常にパ ルス列べク トルで符号化するため、 音声品質の向上を図る上で限界があった。 発明の開示
本発明は以上のような実情に鑑みてなされたものであり、 本発明の第 1の目 的は、 雑音符号帳に雑音符号べク トルをそのまま格納する場合に比べて大幅に メモリ容量を抑制でき、 音声品質の向上を図ることのできる音源べク トル生成 装置並びに音声符号化装置及び音声復号化装置を提供することにある。
本発明の第 2の目的は、 代数的構造音源を雑音符号帳部に備えて雑音符号帳 探索用ターゲットをパルス列べク トルで符号化する場合に比べて複雑な雑音符 号べク トルを生成することができ、 音声品質の向上を図ることのできる音源べ ク トル生成装置並びに音声符号化装置及び音声復号化装置を提供することにあ る。 本発明は、 従来の C E L P型音声符号化ノ復号化装置の固定べクトル読み出 し部および固定符号帳を、 入力されるシードの値に応じて異なるべクトル系列 を出力する発振器および複数個のシード (発振器の種) を格納するシード格納 部にそれぞれ置き換える。これにより、固定べクトルをそのまま固定符号帳(R OM) に格納しておく必要がなくなり、 メモリ容量を大幅に削減できる。 また、 本発明は、 従来の C E L P型音声符号化 復号化装置の雑音ベクトル 読み出し部および雑音符号帳を、 発振器およびシード格納部に置き換える。 こ れにより、 雑音ベクトルをそのまま雑音符号帳 (R OM) に格納しておく必要 がなくなり、 メモリ容量を大幅に削減できる。
また、 本発明は、 複数個の固定波形を格納し、 始端候補位置情報に基づいて それぞれの固定波形を各始端位置に配置し、 これら固定波形を加算して音源べ クトルを生成するように構成した音源べクトル生成装置である。 これにより、 実音声に近い音源べクトルを生成することができる。
また、 本発明は、 雑音符号帳として前記音源ベクトル生成装置を用いて構成 した C E L P型音声符号化 Z復号化装置である。 また、 固定波形配置部が固定 波形の始端候補位置情報を代数的に生成してもよい。
また、 本発明は、 複数個の固定波形を格納し、 固定波形毎の始端候補位置情 報に対するィンパルスを生成し、 合成フィルタのィンパルス応答とそれぞれの 固定波形とを畳み込んで波形別ィンパルス応答を生成し、 前記波形別ィンパル ス応答の自己相関及び相互相関を計算して相関行列メモリに展開するようにし た C E L P型音声符号化 Z復号化装置である。 これにより、 代数的構造音源を 雑音符号帳として使用する場合と同程度の計算コストでありながら、 合成音声 の品質が向上した音声符号化 Z復号化装置が得られる。
また、 本発明は、 複数の雑音符号帳と、 前記複数の雑音符号帳から一つを選 択する切り替え手段とを備えた C E L P型音声符号化 複号化装置であり、 少 なくとも一つの雑音符号帳を前記音源べクトル生成装置としてもよく、 また、 少なくとも一つの雑音符号帳を、 複数のランダム数列を格納したべクトル格納 部または複数のパルス列を格納したパルス列格納部としてもよく、 または、 前 記音源べクトル生成装置を有する雑音符号帳を少なくとも二つ有し、 格納する 固定波形の個数をそれぞれの雑音符号帳で異なるようにしてもよく、 切り替え 手段を、 雑音符号帳探索時の符号化歪みが最小となるようにいずれかの雑音符 号帳を選択するか、 あるいは音声区間の分析結果により適応的にいずれかの雑 音符号帳を選択するようにしてもよい。 図面の簡単な説明
図 1は、 従来の C E L P型音声符号化装置の概略図、
図 2 Aは、図 1の音声符号化装置における音源べクトル生成部のプロック図、 図 2 Bは、 計算コスト削減を図る変形の音源べクトル生成部のブロック図、 図 2 Cは、 図 1の音声符号化装置と対で使用する音声複号化装置における音 源べクトル生成部のブロック図、
図 3は、 実施の形態 1にかかる音声符号化装置の主要部のブロック図、 図 4は、 実施の形態 1の音声符号化装置に備えた音源べクトル生成装置のブ ロック図、
図 5は、 実施の形態 2にかかる音声符号化装置の主要部のプロック図、 図 6は、 実施の形態 2の音声符号化装置に備えた音源べクトル生成装置のブ ロック図、
図 7は、実施の形態 3及び 4にかかる音声符号化装置の主要部のプロック図、 図 8は、 実施の形態 3の音声符号化装置に備えた音源べクトル生成装置のブ ロック図、
図 9は、 実施の形態 4の音声符号化装置に備えた非線形ディジタルフィル夕 のブロック図、
図 1 0は、 図 9に示す非線形ディジタルフィルタの加算特性図、
図 1 1は、 実施の形態 5にかかる音声符号化装置の主要部のブロック図、 図 1 2は、 実施の形態 6にかかる音声符号化装置の主要部のブロック図、 図 1 3 Aは、 実施の形態 7にかかる音声符号化装置の主要部のブロック図、 図 1 3 Bは、 実施の形態 7にかかる音声符号化装置の主要部のブロック図、 図 1 4は、 実施の形態 8にかかる音声復号化装置の主要部のブロック図、 図 1 5は、 実施の形態 9にかかる音声符号化装置の主要部のブロック図、 図 1 6は、 実施の形態 9の音声符号化装置に備えた量子化対象 L S P追加部 のブロック図、
図 1 7は、 実施の形態 9の音声符号化装置に備えた L S P量子化 ·復号化部 のブロック図、
図 1 8は、 実施の形態 1 0にかかる音声符号化装置の主要部のブロック図、 図 1 9 Aは、実施の形態 1 1にかかる音声符号化装置の主要部のブロック図、 図 1 9 Bは、実施の形態 1 1にかかる音声複号化装置の主要部のブロック図、 図 2 0は、 実施の形態 1 2にかかる音声符号化装置の主要部のブロック図、 図 2 1は、 実施の形態 1 3にかかる音声符号化装置の主要部のブロック図、 図 2 2は、 実施の形態 1 4にかかる音声符号化装置の主要部のブロック図、 図 2 3は、 実施の形態 1 5にかかる音声符号化装置の主要部のブロック図、 図 2 4は、 実施の形態 1 6にかかる音声符号化装置の主要部のブロック図、 図 2 5は、 実施の形態 1 6におけるべクトル量子化部分のブロック図、 図 2 6は、 実施の形態 1 7にかかる音声符号化装置のパラメ一夕符号化部の ブロック図、 及び
図 2 7は、 実施の形態 1 8にかかるノイズ削減装置のブロック図、 である。 発明を実施するための最良の形態
以下、 本発明の実施の形態について図面を参照して具体的に説明する。
(実施の形態 1 )
図 3は、 本実施の形態による音声符号化装置の主要部のブロック図である。 この音声符号化装置は、 シード格納部 3 1及び発振器 3 2を有する音源べクト ル生成装置 3 0と、 L P C合成フィル夕部 3 3とを備えている。
シード格納部 3 1から出力されるシード (発振の種) 3 4が発振器 3 2に入 力される。 発振器 3 2は、 入力されるシードの値に応じて異なるベクトル系列 を出力するものである。 発振器 3 2はシード (発振の種) 3 4の値に応じた内 容で発振してベクトル系列である音源ベクトル 3 5を出力する。 また、 L P C 合成フィル夕部 3 3は、 声道情報が合成フィル夕のインパルス応答畳み込み行 列の形で与えられており、 音源べクトル 3 5をインパルス応答で畳み込み演算 することで合成音 3 6を出力する。 音源べクトル 3 5をインパルス応答で畳み 込み演算することを L P C合成と呼ぶ。
図 4に、 音源ベクトル生成装置 3 0の具体的な構成が示されている。 シード 格納部 3 1から読み出すシードをシード格納部制御スィッチ 4 1が歪み計算部 より与えられる制御信号にしたがって切替えている。
このように、 発振器 3 2から異なるべクトル系列を出力させる複数のシード をシード格納部 3 1に格納しておくだけで、 複雑な雑音符号ベクトルを雑音符 号帳にそのまま格納しておく場合に比べて少ない容量でより多くの雑音符号べ クトルを発生することができる。
なお、 本実施の形態では音声符号化装置について説明したが、 音源ベクトル 生成装置 3 0を音声復号化装置に適用することもできる。 この場合、 音声復号 化装置には音声符号化装置のシード格納部 3 1と同じ内容のシード格納部を備 え、 シード格納部制御スィツチ 4 1には符号化時に選択したシ一ド番号が与え られる。
(実施の形態 2 )
図 5は、 本実施の形態による音声符号化装置の主要部のブロック図である。 この音声符号化装置は、 シード格納部 5 1と非線形発振器 5 2を有する音源べ クトル生成装置 5 0と、 L P C合成フィル夕部 5 3とを備えている。
シード格納部 5 1から出力されるシード 5 4は非線形発振器 5 2に入力され る。 非線形発振器 5 2から出力されたべクトル系列である音源べクトル 5 5は L P C合成フィル夕部 5 3に入力される。 L P C合成フィル夕部 5 3の出力は 合成音 5 6である。
非線形発振器 5 2は、 入力されるシード 5 4の値に応じて異なるべクトル系 列を出力するもので、 L P C合成フィル夕部 5 3は、 入力された音源ベクトル 5 5を L P C合成して合成音 5 6を出力する。
図 6に音源べクトル生成装置 5 0の機能ブロックが示されている。 シード格 納部 5 1から読み出すシ一ドをシ一ド格納部制御スィツチ 4 1が歪み計算部よ り与えられる制御信号にしたがって切替えている。
このように、 音源べクトル生成装置 5 0の発振器に非線形発振器 5 2を用い たことにより、 非線形特性にしたがつた発振により発散を抑えることができ、 実用的な音源べクトルを得ることができる。
なお、 本実施の形態では音声符号化装置について説明したが、 音源ベクトル 生成装置 5 0を音声複号化装置に適用することもできる。 この場合、 音声復号 化装置には音声符号化装置のシード格納部 5 1と同じ内容のシード格納部を備 え、 シード格納部制御スィツチ 4 1には符号化時に選択したシード番号が与え られる。
(実施の形態 3 )
図 7は、 本実施の形態による音声符号化装置の主要部のブロック図である。 この音声符号化装置は、 シード格納部 7 1及び非線形ディジタルフィル夕 7 2 を有する音源べクトル生成装置 7 0と、 L P C合成フィルタ部 7 3とを備えて いる。 図中、 符号 7 4はシード格納部 7 1から出力されて非線形ディジタルフ ィル夕 7 2に入力されるシード (発振の種) 、 7 5は非線形ディジタルフィル 夕 7 2から出力されたべクトル系列である音源べクトル、 7 6は L P C合成フ ィル夕部 7 3から出力される合成音である。
音源べクトル生成装置 7 0は、 図 8に示すように歪み計算部より与えられる 制御信号によりシ一ド格納部 7 1から読み出すシード 7 4を切替えるシード格 納部制御スィツチ 4 1を有する。
非線形ディジタルフィル夕 7 2は、 入力されるシードの値に応じて異なるベ クトル系列を出力するもので、 L P C合成フィル夕部 7 3は、 入力された音源 べクトル 7 5を L P C合成して合成音 7 6を出力する。
このように、 音源べクトル生成装置 7 0の発振器に非線形ディジタルフィル 夕 7 2を用いたことにより、 非線形特性にしたがつた発振により発散を抑える ことができ、 実用的な音源ベクトルを得ることができる。 なお、 本実施の形態 では音声符号化装置について説明したが、 音源べクトル生成装置 7 0を音声復 号化装置に適用することもできる。 この場合、 音声復号化装置には音声符号化 装置のシード格納部 7 1と同じ内容のシード格納部を備え、 シード格納部制御 スィツチ 4 1には符号化時に選択したシード番号が与えられる。
(実施の形態 4 )
本実施の形態にかかる音声符号化装置は、 図 7に示すようにシード格納部 7 1及び非線形ディジタルフィルタ 7 2を有する音源べクトル生成装置 7 0と、 L P C合成フィルタ部 7 3とを備えている。
特に、 非線形ディジタルフィルタ 7 2は、 図 9に示す構成を有している。 こ の非線形ディジタルフィルタ 7 2は、 図 1 0に示す非線形加算特性を有する加 算器 91と、 ディジタルフィル夕の状態 (y (k- 1) 〜y (k— N) の値) を保存する作用を有する状態変数保持部 92〜93と、 各状態変数保持部 92 〜93の出力に並列に接続され状態変数にゲインを乗算して加算器 91へ出力 する乗算器 94〜95とを有している。 状態変数保持部 92〜 93は、 状態変 数の初期値がシード格納部 71から読み出されたシードによって設定される。 乗算器 94〜 95はディジタルフィル夕の極が Z平面における単位円外に存在 するようにゲインの値が固定されている。
図 10は、 非線形ディジタルフィル夕 72に備えられた加算器 91の非線形 加算特性の概念図であり、 2の補数特性を有する加算器 91の入出力関係を表 した図である。 加算器 91は、 まず、 加算器 91への入力値の総和である加算 器入力和を求め、 次に、 その入力和に対する加算器出力を算出するために図 1 0に示す非線形特性を用いる。
特に、非線形ディジタルフィル夕 72は、 2次全極構造を採用しているため、 2つの状態変数保持部 92、 93を直列接続しており、 状態変数保持部 92、 93の出力に対して乗算器 94、 95が接続される。 また、 加算器 91の非線 形加算特性が 2の補数特性となっているディジ夕ルフィルタを用いている。 さ らに、 シード格納部 71は、 特に (表 1) に記載した 32wo r d sのシード べクトルを格納している。
表 1 :雑音べクトル生成用のシードべクトル
i Sy(n-l) [i] Sy(n-2) [i] i Sy(n-l) [i] Sy(n-2) [i]
1 0.250000 0.250000 9 0.109521 -0.761210
2 - 0.564643 - 0.104927 10 -0.202115 0.198718
3 0.173879 -0.978792 11 -0.095041 0.863849
4 0.632652 0.951133 12 -0.634213 0.424549
5 0.920360 -0.113881 13 0.948225 - 0.184861
6 0.864873 -0.860368 14 -0.958269 0.969458
7 0.732227 0.497037 15 0.233709 -0.057248
8 0.917543 -0.035103 16 -0.852085 -0.564948 以上のように構成された音声符号化装置では、 シード格納部 7 1から読み出 されたシードべクトルが非線形ディジタルフィル夕 7 2の状態変数保持部 9 2、 9 3に初期値として与えられる。 非線形ディジタルフィル夕 7 2は、 加算器 9 1に入力べクトル(ゼロ系列)からゼロが入力される毎に、 1サンプル(y ( k ) ) ずつ出力し、 状態変数として状態変数保持部 9 2、 9 3に順次転送される。 そ のとき、 個々に状態変数保持部 9 2、 9 3から出力される状態変数に対して各 乗算器 9 4, 9 5でゲイン a 1, a 2が掛けられる。加算器 9 1で乗算器 9 4, 9 5の出力を加算して加算器入力和を求められ、 図 1 0の特性に基づいて + 1 〜一 1の間に抑えられた加算器出力を発生させる。 この加算器出力 (y ( k + 1 ) ) が音源ベクトルとして出力されると共に、 状態変数保持部 9 2、 9 3に 順次転送されて新たなサンプル (y ( k + 2 ) ) が生成される。
本実施の形態は、 非線形ディジタルフィル夕として、 特に、 極が Z平面にお ける単位円外に存在するべく乗算器 9 4〜9 5の係数 1〜Nを固定し、 加算器 9 1に非線形加算特性を持たせているので、 非線形ディジタルフィルタ 7 2の 入力が大きくなつても出力が発散することを抑えることができ、 実用に耐え得 る音源ベクトルを生成しつづけることができる。 また、 生成する音源ベクトル のランダム性を確保することができる。
なお、 本実施の形態では音声符号化装置について説明したが、 音源ベクトル 生成装置 7 0を音声複号化装置に適用することもできる。 この場合、 音声復号 化装置には音声符号化装置のシード格納部 7 1と同じ内容のシード格納部を備 え、 シード格納部制御スィツチ 4 1には符号化時に選択したシード番号が与え られる。
(実施の形態 5 )
図 1 1は、本実施の形態による音声符号化装置の主要部のブロック図である。 この音声符号化装置は、 音源格納部 1 1 1及び音源加算べクトル生成部 1 1 2 を有する音源ベクトル生成装置 1 1 0と、 L P C合成フィルタ部 1 1 3とを備 えている。
音源格納部 1 1 1は、 過去の音源ベクトルが格納されていて、 図示しない歪 み計算部からの制御信号を受けた制御スィツチにより音源べクトルが読み出さ れる。
音源加算べクトル生成部 1 1 2は、 音源格納部 1 1 1から読み出された過去 の音源べクトルに対して生成べクトル特定番号で指示された所定の処理を施し て新しい音源べクトルを生成する。 音源加算べクトル生成部 1 1 2は、 生成べ クトル特定番号に応じて過去の音源べクトルに対する処理内容を切替える機能 を有している。
以上のように構成された音声符号化装置では、 例えば音源探索を実行してい る歪み計算部から生成べクトル特定番号が与えられる。 音源加算べクトル生成 部 1 1 2は、 過去の音源ベクトルに、 入力された生成ベクトル特定番号の値に よって異なる処理を行い、 異なる音源加算ベクトルを生成し、 L P C合成フィ ル夕部 1 1 3は入力された音源ベクトルを L P C合成して合成音を出力する。 このような本実施の形態によれば、 少ない数の過去の音源べクトルを音源格 納部 1 1 1に格納しておき、 音源加算べクトル生成部 1 1 2での処理内容を切 替えるだけで、 ランダムな音源ベクトルを生成することができ、 雑音ベクトル をそのまま雑音符号帳 (R OM) に格納しておく必要がなくなるため、 メモリ 容量を大幅に削減することができる。
なお、 本実施の形態では音声符号化装置について説明したが、 音源ベクトル 生成装置 1 1 0を音声復号化装置に適用することもできる。 この場合、 音声復 号化装置には音声符号化装置の音源格納部 1 1 1と同じ内容の音源格納部を備 え、 音源加算べクトル生成部 1 1 2に対して符号化時に選択した生成べクトル 特定番号が与えられる。 (実施の形態 6 )
図 1 2に本実施の形態にかかる音源べクトル生成装置の機能ブロックを示し ている。 この音源べクトル生成装置は、 音源加算べクトル生成部 1 2 0と、 複 数の要素べクトル 1〜Nが格納された音源格納部 1 2 1とを備えている。
音源加算べクトル生成部 1 2 0は、 音源格納部 1 2 1の異なる位置から異な る長さの要素べクトルを複数個読み出す処理を行う読み出し処理部 1 2 2と、 読み出し処理後の複数個の要素べクトルを逆順に並べ換える処理を行う逆順化 処理部 1 2 3と、 逆順化処理後の複数個のべクトルにそれぞれ異なるゲインを 乗じる処理を行う乗算処理部 1 2 4と、 乗算処理後の複数個のベクトルのべク トル長を短くする処理を行う間引き処理部 1 2 5と、 間引き処理後の複数個の べクトルのべクトル長を長くする処理を行う内挿処理部 1 2 6と、 内挿処理後 の複数個のべクトルをたしあわせる処理を行う加算処理部 1 2 7と、 入力され た生成べクトル特定番号の値に応じた具体的な処理方法を決定し各処理部に指 示する機能およびその具体的処理内容を決定する際に参照する番号変換対応マ ップ (表 2 ) を保持する機能を併せ持つ処理決定 ·指示部 1 2 8とによって構 成される。
表 2 :番号変換対応マップ
ビット列(MS. . . LSB) 6 5 4 3 2 1 0
VI読み出し位置 3 2 1 0
V2 読み出し位置 2 1 0 4 3
V3 読み出し位置 4 3 2 1 0 逆順化処理 (2種類) 0 乗算処理 (4種類) 1 0
間引き処理 (4種類) 1 0
内挿処理 (2種類) 0 ここで、 音源加算ベクトル生成部 120について、 さらに詳しく説明する。 音源加算べクトル生成部 120は、 読み出し処理部 122、 逆順化処理部 12 3、 乗算処理部 124、 間引き処理部 125、 内挿処理部 126、 加算処理部 127のそれぞれの具体的処理方法を、 入力された生成べクトル特定番号 (7 b i t sのビット列で 0から 127の整数値をとる) と、 番号変換対応マップ (表 2) を比較して決定し、 その具体的処理方法を各処理部へ出力する。 読み出し処理部 122は、 まず、 入力された生成ベクトル特定番号の下位の 4ビット列 (n 1 : 0から 15の整数値) に注目し、 音源格納部 121の端か ら n 1の位置まで長さ 100の要素ベクトル 1 (VI) を切り出す。 次に、 入 力された生成べクトル特定番号の下位の 2ビット列と上位 3ビット列を結合し た 5ビット列 (n 2 : 0から 31の整数値) に注目し、 音源格納部 121の端 から n 2 + 14 (14から 45の整数値) の位置まで長さ 78の要素ベクトル 2 (V2) を切り出す。 さらに、 入力された生成ベクトル特定番号の上位の 5 ビット列 (n 3 : 0から 31の整数値) に注目し、 音源格納部 121の端から n 3 + 46 (46から 77の整数値) の位置から長さ Ns (=52) の要素べ クトル 3 (V3) を切り出して、 V I、 V2、 V 3を逆順化処理部 123へ出 力する処理を行う。
逆順化処理部 123は、 生成べクトル特定番号の最下位 1ビットが' 0 ' な ら、 V 1と V 2と V 3を逆順に並べ変えたベクトルを新たに V 1、 V2、 V3 として乗算処理部 124へ出力し、 ' 1 ' なら V 1と V2と V3をそのまま乗 算処理部 124へ出力する処理を行う。
乗算処理部 124は、 生成べクトル特定番号の上位 7ビット目と上位 6ビッ ト目を結合した 2ビット列に注目し、 そのビット列が、 ' 00' なら V 2の振 幅を一 2倍し、 ' 01 ' なら V 3の振幅を _ 2倍し、 ' 10' なら V Iの振幅 を一 2倍し、 ' 1 1 ' なら V 2の振幅を 2倍したベクトルを、 新たな VI、 V 2、 V 3として間引き部 125へ出力する。
間引き処理部 125は、 入力された生成べクトル特定番号の上位 4ビット目 と上位 3ビット目を結合した 2ビット列に注目し、 そのビット列が、
(a) ' 00' なら VI、 V2、 V 3から 1サンプル置きに 26サンプル取り 出したベクトルを新たな V 1、 V2、 V 3として内挿処理部 126へ出力し、
(b) ' 01 ' なら V I、 V 3からは 1サンプルおきに、 V2からは 2サンプ ルおきに 26サンプ取り出したベクトルを、 新たな VI、 V3、 V 2として内 挿処理部 126へ出力し、
(c) ' 10' なら V 1からは 3サンプル置きに、 V2、 V3からは 1サンプ ル置きに 26サンプル取り出したベクトルを新たな V 1、 V2、 V 3として内 揷処理部 126へ出力し、
(d) ' 1 1 ' なら V 1からは 3サンプル置きに、 V2からは 2サンプル置き に、 V 3からは 1サンプル置きに 26サンプル取り出したべクトルを新たな V 1、 V2、 V 3として内挿処理部 77へ出力する。
内挿処理部 126は、 生成ベクトル特定番号の上位 3ビット目に注目し、 そ の値が、
(a) ' 0' なら VI、 V2、 V3をそれぞれ長さ Ns (=52) のゼロべク トルの偶数番目サンプルに代入したベクトルを新たな V 1、 V2、 V3として 加算処理部 75へ出力し、
(b) ' 1 ' なら V I、 V2、 V3をそれぞれ長さ Ns (=52) のゼロべク トルの奇数数番目サンプルに代入したベクトルを新たな V 1、 V2、 V3とし て加算処理部 75へ出力する。
加算処理部 127は、 内挿処理部 126より生成された 3つのベクトル (V 1, V2, 3) を加算して音源加算ベクトルを生成して出力する。
このように本実施の形態は、 生成べクトル特定番号に応じて複数の処理をラ ンダムに組み合せて複雑でランダムな音源べクトルを生成するので、 雑音べク トルをそのまま雑音符号帳 (ROM) に格納しておく必要がなくなり、 メモリ 容量を大幅に削減することができる。
なお、 実施の形態 5の音声符号化装置において、 本実施の形態の音源べクト o
ル生成装置を用いること Sにより、 大容量の雑音符号帳を持つことなく複雑でラ
2
ンダムな音源べクトルを生成することができる。
(実施の形態 7)
日本国内の P D Cディジタル携帯電話における音声符号化 復号化標準方式 である P S I _CEL Pをベースにした CEL P型音声符号化装置に上記した 実施の形態 1〜実施の形態 6のいずれかに示した音源べクトル生成装置を用い る例を実施の形態 7として説明する。
図 13に、 実施の形態 7にかかる音声符号化装置のブロック図が示されてい る。 この音声符号化装置では、 ディジタルの入力音声データ 1300は、 フレ —ム単位 (フレーム長 N f = 104) でバッファ 1301へ供給される。 この 時、 バッファ 1301内の古いデ一夕は、 供給される新しいデータによって更 新されることになる。 フレームパヮ量子化'復号部 1302は、 まず、 バッフ ァ 1301から長さ N f (=104) の処理フレーム s ( i ) (0≤ i≤N f — 1) を読み出し、 その処理フレーム内サンプルの平均パヮ ampを(数式 5) により求める。
amp
Nf (5) amp:処理フレーム内サンプルの平均パヮ
i:処理フレーム内の要素番号 ( 0 ≤ i ≤ Nf-1 )
s(i) :処理フレーム内サンプル Nf :処理フレーム長 ( =52 )
求めた処理フレーム内サンプルの平均パヮ ampを (数式 6) により対数変 換値 amp 1 ogに変換する。
, logi 0 (255 amp + 1)
amp log = ~
log10(255 + l) (g) amp log :処理フレーム内サンプルの平均パヮの対数変換値
amp :処理フレーム内サンプルの平均パヮ
求めた amp 1 o gをパヮ量子化テーブル格納部 1303に格納された (表 3) に示すような 1 Owo r d sのスカラー量子化用テ一ブル C p owを用い てスカラー量子化することで 4 b i t sのパワインデクス I p owを得、 得ら れたパワインデクス I p owから復号化フレームパヮ s p owを求め、 パワイ ンデクス I p owと複号化フレームパヮ s p owをパラメ一夕符号化部 133 1へ出力する。 パヮ量子化テーブル格納部 1303は、 16wo r d sのパヮ スカラー量子化テーブル (表 3) を格納していて、 このテ一ブルは、 フレーム パヮ量子化 ·復号部 1302が処理フレーム内サンプルの平均パヮの対数変換 値をスカラー量子化する時に参照される。
表 3 :パヮスカラ量子化用テーブル
1 Cpoww 1 Cpow(i)
1 0.00675 9 0.39247
2 0.06217 10 0.42920
3 0.10877 11 0.46252
4 0.16637 12 0.49503
5 0.21876 13 0.52784
6 0.26123 14 0.56484
7 0.30799 15 0.61125
8 0.35228 16 0.67498 LP C分析部 1304は、 まず、 バッファ 1301から分析区間長 Nw (= 256) の分析区間データを読み出し、 読み出した分析区間データに窓長 Nw (= 256) のハミング窓 Whを乗じてハミング窓掛け済み分析区間データを 得、 得られたハミング窓掛け済み分析区間デ一夕の自己相関関数を予測次数 N p (= 10) 次まで求める。 求めた自己相関関数にラグ窓格納部 1305に格 納した 1 Owo r d sのラグ窓テーブル (表 4) を乗じてラグ窓掛け済み自己 相関関数を得、 得られたラグ窓掛け済み自己相関関数に対して線形予測分析を 行うことで LPCパラメ一夕 α ( i ) (1≤ i≤Np) を算出してピッチ予備 選択部 1308に出力する。
表 4 : ラグ窓テーブル
Figure imgf000022_0001
次に、 求めた LP Cパラメ一夕ひ ( i ) を LSP (線スペクトル対) ω ( i) (1≤ i≤Np) に変換して LS P量子化 ·復号化部 1306に出力する。 ラ グ窓格納部 1305は、 L PC分析部が参照するラグ窓テーブルを格納してい る。
L S P量子化 ·復号化部 1306は、 まず、 LSP量子化テーブル格納部 1 307に格納した L S Pのべクトル量子化用テーブルを参照して、 L P C分析 部 1304から受けた LS Pをべクトル量子化して最適インデクスを選び、 選 んだインデクスを LSP符号 I 1 s pとしてパラメ一夕符号化部 1331へ出 力する。 次に、 LSP量子化テーブル格納部 1307から LSP符号に対応す るセントロイドを複号化 LSPioq ( i) (1≤ i≤Np) として読み出し、 読み出した複号化 LSPを LSP補間部 131 1へ出力する。 さらに、 復号化 L S Pを LPCに変換することで複号化 LPCひ Q ( i ) (l≤ i≤Np) を 得、 得られた復号化 LPCをスペクトル重み付けフィルタ係数算出部 1312 および聴感重み付け LP C合成フィル夕係数算出部 1314へ出力する。 LS P量子化テーブル格納部 1307は、 L S P量子化 ·復号化部 1306が L S Pをべクトル量子化する時に参照する L S Pべクトル量子化テーブルを格納し ている。
ピッチ予備選択部 1308は、 まず、 バッファ 1301から読み出した処理 フレームデ一夕 s ( i ) (0≤ i≤N f - 1) に対し、 LPC分析部 1304 より受けた L PC α ( i ) (1≤ i≤Np) によって構成した線形予測逆フィ ル夕リングを施し、 線形予測残差信号 r e s (i) (0≤i≤Nf — 1) を得、 得られた線形予測残差信号 r e s (i) のパヮを計算し、 計算した残差信号の パヮを処理サブフレームの音声サンプルのパヮで正規化した値である正規化予 測残差パヮ r e s i dを求めてパラメ一夕符号化部 1331へ出力する。次に、 線形予測残差信号 r e s (i) に長さ Nw (= 256) のハミング窓を乗じて ハミング窓掛け済み線形予測残差信号 r e sw (i) (0≤ i≤Nw— 1) を 生成し、 生成した r e s w ( i ) の自己相関関数 Φ i n t (i) を Lmi n— 2≤ i≤Lmax+2 (ただし、 Lm i nは長期予測係数の最短分析区間で 1 6、 Lm a Xは長期予測係数の最長分析区間で 128とする)の範囲で求める。 求めた自己相関関数 Φ i n t (i) にポリフェーズ係数格納部 1309に格納 された 28wo r d sのポリフエ一ズフィルタの係数 Cp p f (表 5) を畳み 込んで、 整数ラグ i n tにおける自己相関 Φ i n t (i) 、 整数ラグ i n tよ り一 1Z4ずれた分数位置における自己相関 dci (i) 、 整数ラグ i n tよ り +1Z4ずれた分数位置における自己相関 <i aq (i) 、 整数ラグ i n tよ り + 1Z2ずれた分数位置における自己相関 Φ ah (i) をそれぞれ求める。 表 5 :ポリフェーズフィル夕係数 Cppf
Figure imgf000024_0001
さらに、 Lm i n— 2≤ i≤Lm a x + 2の範囲内にある引数 ίそれぞれに ついて φ i n t ( i ) 、 Φ d q ( i ) 、 φ a q ( i ) 、 φ a h ( i ) の中から 最大のものを ci>max ( i) に代入する、 (数式 7) の処理を行うことで (L max-Lm i n+ 1) 個の 0max ( i ) を求める。
φ max(i) = MAX( int(i), dq(i), aq(i), a (i))
φ max(i) : 0int(i), dq (り, <>aq(i),0ah(i)の最大値 (7)
I :長期予測係数の分析区間 ( Lmin≤ i Lmax )
Lmin :長期予測係数の分析最短区間 ( =16 )
Lmax :長期予測係数の分析最長区間 ( =128 )
φ int(i) :予測残差信号の整数ラグ ( int ) における自己相関関数 φ dq(i) :予測残差信号の分数ラグ ( int-1/4 ) における自己相関関数 φ aq(i) :予測残差信号の分数ラグ ( int + 1/4 ) における自己相関関数 φ ah(i) :予測残差信号の分数ラグ ( int+1/2 ) における自己相関関数 求めた (Lma X— Lm i n+ 1) 個の 0max ( i ) のから、 値が大きい ものを上位から順に 6個選び出してピッチ候補 p s e 1 ( i ) (0≤ i≤ 5) として保存し、 線形予測残差信号 r e s ( i) とピッチ第一候補 p s e 1 (0) をピッチ強調フィルタ係数算出部 1310へ、 p s e l ( i ) (0≤ i≤ 5) を適応ベクトル生成部 1319へ出力する。
ポリフェーズ係数格納部 1309は、 ピッチ予備選択部 1308が線形予測 残差信号の自己相関を分数ラグ精度で求める時、 および、 適応ベクトル生成部 1319が適応べクトルを分数精度で生成する時に参照するポリフェーズフィ ル夕の係数を格納している。
ピッチ強調フィルタ係数算出部 1310は、 ピッチ予備選択部 1308で求 めた線形予測残差 r e s ( i ) とピッチ第一候補 p s e l (0) から 3次のピ ツチ予測係数 c o V ( i ) (0≤ i≤2) を求める。 求めたピッチ予測係数 c o V ( i ) (0≤ i≤2) を用いた (数式 8) により、 ピッチ強調フィル夕 Q (z) のインパルス応答を求めて、 スペクトル重み付けフィルタ係数算出部 1 312および聴感重み付けフィル夕係数算出部 1313へ出力する。
2
Q^z) =1+ cov^i) X λρι χ ζ - psel(0) + ι - 1
i=0 (8)
Q(z) : ピッチ強調フィルタの伝達関数
cov(i) : ピッチ予測係数 ( 0 i ≤ 2 )
λρΐ : ピッチ強調定数 ( =0.4 )
psel(O) : ピッチ第 1候補
L S P補間部 131 1は、 まず、 L S P量子化 ·復号化部 1306において 求めた現処理フレ一ムに対する復号化 L S PC Q ( i ) と以前に求め保持して おいた前処理フレームの復号化 L S PCOQ P ( i ) を用いた (数式 9) により、 復号化補間 L S Ρω i n t p (n, i ) ( 1≤ i≤Np) をサブフレーム毎に 求める。
(O.4x >q(i) + 0.6xojqp(i) n = 1
ω int p(n, i)
uq(i) n = 2 (9) ω intp(n,j) :第 nサブフレームの補間 LSP
n:サブフレーム番号 ( =1,2 )
ω q(i) :処理フレームの複号化 LSP ω qp(i) :前処理フレームの復号化 LSP
求めた ω i n t p (n, i ) を L P Cに変換することで複号化補間 L P C a q (n, i) (1≤ i≤Np) を得、 得られた複号化補間 L P C a Q (n, i) (1≤ i≤Np) をスぺクトル重み付けフィル夕係数算出部 1312および聴 感重み付け LP C合成フィルタ係数算出部 1314に出力する。
スぺクトル重み付けフィル夕係数算出部 1312は、 (数式 10) の MA型 スペクトル重み付けフィルタ I (z) を構成し、 そのインパルス応答を聴感重 み付けフィルタ係数算出部 1313へ出力する。
Nfir
I(z) = aiir^i) χ z一1
i=i (10)
I(z) : MA型スぺクトル重み付けフィル夕の伝達関数
Nfir: I(z)のフィル夕次数 ( =11 )
a fir(i) : Kz)のフィル夕次数 ( 1 ≤ i ≤ Nfir )
ただし、 (数式 10) 中のインパルス応答 a f i r ( i ) (1≤ i≤N f i r) は、 (数式 1 1) で与えられる ARMA型スペクトル強調フィル夕 G (z) のインパルス応答を N f i r (=1 1) 項までで打ち切ったものである。
G(z) け 1)
Figure imgf000026_0001
G(z) :スぺクトル重み付けフィルタの伝達関数
n:サブフレーム番号 ( =1,2 )
Np: L PC分析次数 ( =10 )
a (n, i) :第 nサブフレームの複号化補間 LSP
λ ma: G(z)の分子用定数 ( =0.9 )
λ ar: G(z)の分母用定数 ( =0.4 ) 聴感重み付けフィルタ係数算出部 1313は、 まず、 スぺクトル重み付けフ ィル夕係数算出部 1312から受けたスペクトル重み付けフィルタ I (z) の インパルス応答とピッチ強調フィル夕係数算出部 1310から受けたピッチ強 調フィル夕 Q (z) のインパルス応答を畳み込んだ結果をインパルス応答とし て持つ聴感重み付けフィル夕 W (z) を構成し、 構成した聴感重み付けフィル 夕 W (z) のインパルス応答を聴感重み付け LP C合成フィルタ係数算出部 1 314および聴感重み付け部 1315へ出力する。
聴感重み付け LP C合成フィルタ係数算出部 1314は、 LSP補間部 13 1 1から受けた復号化補間 LPCaq (n, i) と聴感重み付けフィル夕係数 算出部 1313から受けた聴感重み付けフィルタ W (z) によって、 聴感重み 付け LPC合成フィル夕 H (z) を (数式 12) によって構成する。
Figure imgf000027_0001
H(z) :聴感重み付き合成フィル夕の伝達関数
Np : LPC分析次数
aq (n, 0 :第 nサブフレームの復号化補間 LPC
n:サブフレーム番号 ( =1,2 )
W(z) :聴感重み付けフィル夕 ( I(z)と Q(z)を縦属接続) の伝達関数 構成した聴感重み付き LP C合成フィルタ H (z) の係数を、 ターゲット生 成部 A 1316、 聴感重み付け L P C逆順合成部 A 1317、 聴感重み付け L P C合成部 A 1321、 聴感重み付け L P C逆順合成部 B 1326および聴感 重み付け LP C合成部 B 1329へ出力する。
聴感重み付け部 1315は、 バッファ 1301から読み出したサブフレーム 信号をゼロ状態の聴感重み付き LPC合成フィル夕 H (z) に入力し、 その出 力を聴感重み付き残差 s pw ( i ) (0≤ i≤N s - 1) としてターゲット生 成部 A 13 1 6へ出力する。
ターゲット生成部 A 1 3 1 6は、 聴感重み付け部 1 3 1 5において求めた聴 感重み付き残差 s pw ( i ) (0≤ i≤N s - 1) から、 聴感重み付け LP C 合成フィル夕係数算出部 1 3 14において求めた聴感重み付き LP C合成フィ ル夕 H (z) にゼロ系列を入力した時の出力であるゼロ入力応答 Z r e s ( i ) (0≤ i≤N s - l) を減算し、 減算結果を音源選択用の夕一ゲットベクトル r ( i) (0≤ i≤Ns— 1) として聴感重み付け L P C逆順合成部 A 1 3 1 7および夕ーゲット生成部 B 1 325へ出力する。
聴感重み付け L P C逆順合成部 A 1 3 1 7は、 ターゲット生成部 A 1 3 16 から受けたターゲットベクトル r ( i ) (0≤ i≤N s— 1) を時間逆順に並 ベ換え、 並べ換えて得られたべクトルを初期状態がゼロの聴感重み付け LP C 合成フィルタ H (z) に入力し、 その出力を再度時間逆順に並べ換えることで ターゲットベクトルの時間逆合成ベクトル r h (k) (0≤ i≤Ns— 1) を 得て比較部 A 1 322に出力する。
適応符号帳 1 3 1 8は、 適応べクトル生成部 1 3 1 9が適応べクトルを生成 する際に参照する過去の駆動音源を格納している。 適応べクトル生成部 13 1 9は、 ピッチ予備選択部 1 308から受けた 6個のピッチ候補 p s e 1 ( j ) (0≤ j≤ 5) をもとに、 N a c個の適応ベクトル P a c b ( i , k) (0≤ i≤Ν a c - 1 , 0≤k≤N s - 1 , 6≤N a c≤ 24 ) を生成して適応 固 定選択部 1 320へ出力する。 具体的には、 (表 6) に示すように、 1 6≤p s e 1 ( j ) ≤44の場合には、 一つの整数ラグ位置あたり 4種類の分数ラグ 位置について適応ベクトルを生成し、 45≤p s e l (j ) ≤64の場合には、 一つの整数ラグ位置あたり 2種類の分数ラグ位置について適応べクトルを生成 し、 65≤p s e l (j ) ≤ 128の場合には、 整数ラグ位置に対して適応べ クトルを生成する。 これより、 p s e l (j ) (0≤ j≤ 5) の値によって適 応べクトルの候補数 N a cは最少で 6候補、 最多で 24候補になる。
表 6 :適応べクトルと固定べクトルの総数
Figure imgf000029_0001
なお、 分数精度の適応べクトルを生成する際には、 適応符号帳 1318から 整数精度で読み出した過去の音源べクトルに、 ポリフェーズ係数格納部 130 9に格納されているポリフェーズフィル夕の係数を畳み込む補間処理により行 つている。
ここで、 l ag f ( i ) の値に対応する補間とは、 l ag f ( i ) = 0の場 合は整数ラグ位置、 l ag f (i) = 1の場合は整数ラグ位置から一 1 2ず れた分数ラグ位置、 l ag f (i) =2の場合は整数ラグ位置より + 1 4ず れた分数ラグ位置、 l ag f (i) =3の場合は整数ラグ位置より一 1 4ず れた分数ラグ位置に対応した補間を行うことである。
適応ノ固定選択部 1320は、 まず、 適応べクトル生成部 1319が生成し た Na c (6〜24) 候補の適応ベクトルを受け、 聴感重み付け LP C合成部 A 1321および比較部 A 1322へ出力する。
比較部 A 1322は、 まず始めに、 適応べクトル生成部 1319が生成した 適応ベクトル P a c b (i, k) (0≤ i≤Na c - 1, 0≤k≤N s - 1 , 6≤Na c≤24) を Na c (6〜24) 候補から Na c b (=4) 候補に予 備選択するため、 聴感重み付け LP C逆順合成部 A 1317より受けたターゲ ットベクトルの時間逆合成ベクトル r h (k) (0≤k≤N s - 1) と適応べ クトル P a c b (i, k) との内積 p r a c ( i) を (数式 13) により求め る。
Ns-l
prac(i) = J Pacb(i, k) x rh(k) (1 3)
k=0
Prac(i) :適応べクトル予備選択基準値
Nac :予備選択後適応べクトル候補数 ( = 6〜24 )
i:適応べクトルの番号 ( 0≤ i ≤ Nac - 1 )
Pacb(i.k) :適応べクトル
rh(k) :ターゲットベクトル r(k)の時間逆合成べクトル
求めた内積 p r a c ( i) を比較して、 その値が大きくなる時のインデクス およびそのインデクスを引数とした時の内積を上位 Na c b (=4) 番目まで 選択し、 適応ベクトル予備選択後インデクス ap s e 1 (j ) (0≤ j≤Na c b- 1) および適応べクトル予備選択後基準値 p r a c (a p s e 1 ( j ) ) としてそれぞれ保存していき、 適応ベクトル予備選択後インデクス a p s e 1 ( j ) (0≤ j≤Na c b - 1) を適応 Z固定選択部 1320へ出力する。 聴感重み付け L P C合成部 A 1321は、 適応べクトル生成部 1319にお いて生成され適応 固定選択部 1320を通過した予備選択後適応べクトル P a c b (a p s e 1 ( j ) , k) に対して聴感重み付け L P C合成を施して合 成適応べクトル SYNa c b (a p s e 1 ( j ) , k) を生成し、 比較部 A 1 322へ出力する。 比較部 A1322は、 次に、 比較部 A 1322自身におい て予備選択した Na c b (=4) 個の予備選択後適応ベクトル P a c b (ap s e 1 ( j ) , k) を本選択するために、 適応ベクトル本選択基準値 s ac b r ( j ) を (数式 14) により求める。 sacbr(j) (14)
Figure imgf000030_0001
sacbr(j) :適応べクトル本選択基準値
pracO :適応べクトル予備選択後基準値
apsel(j) :適応べクトル予備選択インデクス
k:べクトル次数 ( 0≤ j ≤ Ns - 1 )
j :予備選択された適応べクトルのインデクスの番号
( 0 ≤ j ≤ Nacb - 1 )
Ns :サブフレーム長 ( =52 )
Nacb:適応べクトルの予備選択数 ( =4 )
SYNacb(J,K) :合成適応ベクトル
(数式 14) の値が大きくなる時のインデクスおよびそのインデクスを引数 とした時の (数式 14) の値をそれぞれ、 適応ベクトル本選択後インデクス A S ELおよび適応ベクトル本選択後基準値 s a c b r (AS EL) として適応 固定選択部 1320へ出力する。
固定符号帳 1323は、 固定べクトル読み出し部 1324が読み出すべク卜 ルを N f c (= 16) 候補格納している。 比較部 A1322は、 ここで、 固定 べクトル読み出し部 1324が読み出した固定べクトル P f c b ( i , k) (0 ≤ i≤N f c - 1 , 0≤k≤N s - 1) を、 N f c (= 16) 候補から N i c b (=2) 候補に予備選択するため、 聴感重み付け LP C逆順合成部 A131 7より受けたターゲットベクトルの時間逆合成ベクトル r h (k) (0≤k≤ N s— 1 )と固定べクトル P f c b ( i , k)との内積の絶対値 I p r f c ( i ) Iを (数式 15) により求める。
Ns-l
|prfc(i)| = J Pfcb(i. k) x rh(k) (15)
k=0
|prfc(i) I:固定べクトル予備選択基準値
k:べクトルの要素番号 ( o≤ k≤ Ns - 1 ) i:固定べクトルの番号 ( 0≤ i ≤ Nfc - 1 )
Nfc :固定べクトル数 ( = 16 )
Pfcb(i.k) :固定べクトル
rh(k) :ターゲットベクトル r(k)の時間逆合成べクトル
(数式 15) の値 I p r a c ( i) Iを比較して、 その値が大きくなる時の インデクスおよびそのインデクスを引数とした時の内積の絶対値を上位 N f c b (=2)番目まで選択し、固定ベクトル予備選択後インデクス f p s e 1 ( j ) (0≤ j≤N f c b— 1)および固定べクトル予備選択後基準値 I p r f c (f p s e 1 ( j ) ) Iとしてそれぞれ保存していき、 固定べクトル予備選択後ィ ンデクス f p s e l ( j ) (0≤ j≤N f c b— 1) を適応 Z固定選択部 13 20へ出力する。
聴感重み付け LP C合成部 A 1321は、 固定ベクトル読み出し部 1324 において読み出され適応 固定選択部 1320を通過した予備選択後固定べク トル P f c b (f s e l (j ) , k) に対して聴感重み付け LP C合成を施 して合成固定べクトル S YN f c b (f p s e l ( j ) , k) を生成し、 比較 部 A 1322へ出力する。
比較部 A 1322は、 さらに、 比較部 A 1322自身において予備選択した N f c b (=2) 個の予備選択後固定べクトル P f c b (f p s e l (j ) , k) から最適な固定ベクトルを本選択するために、 固定ベクトル本選択基準値 s f c b r ( j ) を (数式 16) により求める。 sfcbr(j)= ( 1 ( (16)
Ns _1 sYNfcb2(j,k)
ム k = 0 sfcbr(j) :固定べクトル本選択基準値
|prfc( ) I:固定べクトル予備選択後基準値 fpsel(j) :固定べクトル予備選択後インデクス ( 0 j Nfcb - 1 ) k:べクトルの要素番号 ( 0≤ k≤ Ns - 1 )
j :予備選択された固定べクトルの番号 ( 0≤ j≤ Nfcb― 1 )
Ns :サブフレーム長 ( =52 )
Nfcb:固定べクトルの予備選択数 ( =2 )
SYNfcb(j,k) :合成固定べクトル
(数式 16) の値が大きくなる時のインデクスおよびそのインデクスを引数 とした時の (数式 16) の値をそれぞれ、 固定ベクトル本選択後インデクス F S ELおよび固定ベクトル本選択後基準値 s a c b r (FSEL) として適応 Z固定選択部 1320へ出力する。
適応 Z固定選択部 1320は、 比較部 A 1322より受けた p r a c (AS EL) > s a c b r (ASEL) 、 I p r f c (FSEL) Iおよび s f c b r (FSEL) の大小および正負関係により ( (数式 17) に記載) 、 本選択 後適応べクトルと本選択後固定べクトルのどちらか一方を適応 Z固定べクトル AF (k) (0≤k≤N s - 1) として選択する。
Pacb(ASEL'k) sacbr(ASEL)≥ sfcbr(FSEL), prac(ASEL) > 0 0 sacbr(ASEL)≥ sfcbr(FSEL), prac(ASEL)≤ 0
AF(k)
Pfcb(FSEL,k) sacbr(ASEL) < sfcbr(FSEL), prfc(FSEL)≥ 0 -Pfcb(FSEL.k) sacbr(ASEL) < sfcbr(FSEL), prfc(FSEL) < 0
(17)
AF(k) :適応 Z固定べクトル
ASEL:適応べクトル本選択後ィンデクス
FSEL:固定べクトル本選択後インデクス
k :べクトルの要素番号
Pacb(ASEL,k) :本選択後適応べクトル
Pfcb(FSEL,k) :本選択後固定べクトル sacbr(ASEL) :適応べクトル本選択後基準値
sfcbr(FSEL) :固定べクトル本選択後基準値
prac(ASEL) :適応べクトル予備選択後基準値
prfc(FSEL) :固定べクトル予備選択後基準値
選択した適応 Z固定ベクトル AF (k) を聴感重み付け LP C合成フィル夕 部 A1321に出力し、 選択した適応ノ固定ベクトル A F (k) を生成した番 号を表すィンデクスを適応ノ固定ィンデクス AF S ELとしてパラメ一夕符号 化部 1331へ出力する。 なおここでは、 適応ベクトルと固定ベクトルの総べ クトル数が 255個になるように設計しているので (表 6参照) 、 適応ノ固定 インデクス AFSELは 8 b i t s符号になっている。
聴感重み付き LP C合成フィル夕部 A 1321は、 適応/固定選択部 132 0において選択された適応 固定ベクトル A F (k) に対して聴感重み付け L PC合成フィルタリングを施して合成適応ノ固定べクトル S YNa f (k) (0 ≤k≤N s - 1) を生成し、 比較部 A 1322へ出力する。
比較部 A 1322は、 ここで、 まず、 聴感重み付け L P C合成部 A 1321 より受けた合成適応ノ固定ベクトル S YNa f (k) (0≤k≤Ns - 1) の パヮ p owpを (数式 18) により求める。
Ns-l
powp = 2 SYNaf2(k) (18)
k-0
powp:適応/固定ベクトル (SYNaf(k)) のパヮ
k:べクトルの要素番号 ( 0≤ k≤ Ns - 1 )
Ns:サブフレーム長 ( =52 )
SYNaf (k) :適応 Z固定べクトル
次に、 夕ーゲット生成部 A 1316から受けた夕ーゲットべクトルと合成適 応 /固定ベクトル SYNa f (k) の内積 p rを (数式 19) により求める。 Ns-l
pr = JSYNaf(k)xr(k) (19)
k-0
pr: SYNaf (k)と r(k)の内積
Ns:サブフレーム長 ( =52 )
SYNaf (k) :適応/固定べクトル
r (k) :ターゲットべクトル
k:べクトルの要素番号 ( 0≤ k≤ Ns - 1 )
さらに、適応ノ固定選択部 1 320より受けた適応 Z固定べクトル AF (k) を適応符号帳更新部 1333へ出力し、 AF (k) のパヮ POWa f を計算し、 合成適応 Z固定ベクトル S YNa f (k) と POWa f をパラメ一夕符号化部 1331へ出力し、 powpと p rと r (k) と r h (k) を比較部 B 133 0へ出力する。
夕一ゲット生成部 B 1325は、 夕ーゲット生成部 A 1316より受けた音 源選択用のターゲットベクトル r ( i ) (0≤ i≤N s— 1) から、 比較部 A 1322より受けた合成適応 固定ベクトル S YNa f (k) (0≤k≤Ns — 1) を減算して新ターゲットベクトルを生成し、 生成した新ターゲットべク トルを聴感重み付け LP C逆順合成部 B 1326へ出力する。
聴感重み付け L P C逆順合成部 B 1326は、 ターゲッ卜生成部 B 1325 において生成した新タ一ゲットべクトルを時間逆順に並べ換え、 並べ換えたベ クトルをゼロ状態の聴感重み付け LP C合成フィルタに入力し、 その出力べク トルを再度時間逆順に並べ換えることで新ターゲットべクトルの時間逆合成べ クトル ph (k) (0≤k≤N s - 1) を生成して比較部 B 1330へ出力す る。
音源べクトル生成装置 1337は、 例えば実施の形態 3で説明した音源べク トル生成装置 70と同じものを用いる。 音源ベクトル生成装置 70は、 シード 格納部 71から 1番目のシードが読み出されて非線形ディジタルフィル夕 72 へ入力して雑音べクトルが生成される。 音源べクトル生成装置 70で生成され た雑音べクトルが聴感重み付け LP C合成部 B 1329および比較部 B 133 0へ出力される。 次に、 シード格納部 71から 2番目のシードが読み出されて 非線形ディジタルフィル夕 72へ入力して雑音べクトルが生成され、 聴感重み 付け LP C合成部 B 1329および比較部 B 1330へ出力する。
比較部 B 1330は、 1番目のシードに基づいて生成された雑音べクトルを を Ns t (=64) 候補から Ns t b (=6) 候補に予備選択するため、 1番 目雑音べクトル予備選択基準値 c r ( i 1) (0≤ i l≤Ns t b l— 1) を (数式 20) により求める。
Ns-l n Ns-1
criil) = V Pstbl(ilj)xrh(j)-^- Pstbl(ilj) x ph(j) (20)
j O P。WP j 6
cr(il) : 1番目雑音ベクトル予備選択基準値
Ns:サブフレーム長 ( =52 )
rh(j) :夕ーゲットべクトル ( r (j) ) の時間逆合成べクトル
powp:適応ノ固定べクトル ( SYNaf (k) ) のパヮ
pr: SYNaf (k)と r (k)の内積
PstbKil, j) : 1番目雑音べクトル
ph(j) : SYNaf (k)の時間逆合成べクトル
il: 1番目雑音べクトルの番号( 0≤ il≤ Nst -1 )
j :べクトルの要素番号
求めた c r ( i 1) の値を比較して、 その値が大きくなる時のインデクスお よびそのインデクスを引数とした時の(数式 20) の値を上位 N s t b (=6) 番目まで選択し、 1番目雑音ベクトル予備選択後インデクス s 1 p s e 1 ( j 1) (0≤ j 1≤N s t b- 1) および予備選択後 1番目雑音べクトル P s t b 1 ( s 1 s e 1 (j 1) , k) (0≤ j 1≤N s t b - 1, 0≤k≤N s — 1) としてそれぞれ保存していく。 次に、 2番目雑音ベクトルについても 1 番目と同様の処理を行い 2番目雑音べクトル予備選択後インデクス s 2 p s e 1 (j 2) (0≤j 2≤Ns t b— 1) および予備選択後 2番目雑音ベクトル P s t b 2 ( s 2 p s e 1 (j 2) , k) (0≤ j 2≤N s t b- 1, 0≤k ≤Ns - 1) としてそれぞれ保存していく。
聴感重み付け LP C合成部 B 1329は、 予備選択後 1番目雑音べクトル P s t b 1 (s l p s e l (j 1) , k) に対して聴感重み付け L P C合成を施 して合成 1番目雑音べクトル S YN s t b 1 (s l s e l (j 1) , k) を 生成して比較部 B 1330へ出力する。 次に、 予備選択後 2番目雑音べクトル P s t b 2 (s 2 p s e 1 (j 2) , k) に対して聴感重み付け L P C合成を 施して合成 2番目雑音べクトル S YN s t b 2 (s 2 p s e 1 (j 2) , k) を生成して比較部 B 1330へ出力する。
比較部 B 1330は、 比較部 B 1330自身において予備選択した予備選択 後 1番目雑音べクトルと予備選択後 2番目雑音べクトルの本選択を行うために、 聴感重み付け L P C合成部 B 1329において計算した合成 1番目雑音べクト ル S YN s t b 1 (s l p s e l (j 1) , k) に対して (数式 21) の計算 を行う。
SYNOstbl(slpsel(jl),k) = SYNstbl(slpsel(jl),k)
slpsel(jl),k)xph(k) υο\νρ " k = 0
(21)
SYNOstbl (slpsel (jl),k) :直交化合成 1番目雑音べクトル
SYNstbl (slpsel (jl),k) :合成 1番目雑音べクトル
Pstbl(slpsel(jl),k) :予備選択後 1番目雑音べクトル
SYNaf (j) :適応 固定べクトル powp:適応ノ固定ベクトル ( SYNaf (j) ) のパヮ
Ns :サブフレーム長( =52 )
ph(k) : SYNaf (j)の時間逆合成べクトル
j 1:予備選択後 1番目雑音べクトルの番号
k:べクトルの要素番号( 0≤ k≤ Ns - 1 )
直交化合成 1番目雑音べクトル SYNOs t b 1 (s 1 p s e 1 (j 1) , k) を求め、 合成 2番目雑音べクトル S YNs t b 2 (s 2 p s e 1 ( j 2) , k) に対しても同様の計算を行って直交化合成 2番目雑音べクトル S Y N O s t b 2 (s 2 p s e 1 (j 2) , k) を求め、 1番目雑音べクトル本選択基準 値 s 1 c rと 2番目雑音ベクトル本選択基準値 s 2 c rをそれぞれ (数式 22) と (数式 23) を用いて、 (s 1 p s e 1 (j 1) , s 2 p s e 1 (j 2) ) の全組み合わせ (36通り) についてクローズドループで計算する。 csc rl2
scrl = -""―——
V S " [SYNOstbl(slpsel(jl), k) + SYNOstb2(s2psel(j2), )J ム k = 0
(22) scrl: 1番目雑音べクトル本選択基準値
cscrl: (数 24) により前もって計算しておいた定数
SYNOstbl(slpsel(jl),k) :直交化合成 1番目雑音べクトル
SYNOstb2(s2psel(j2),k) :直交化合成 2番目雑音べクトル
r(k) :夕一ゲットべクトル
slpsel(jl) : 1番目雑音ベクトル予備選択後インデクス
s2psel(j2) : 2番目雑音ベクトル予備選択後インデクス
Ns :サブフレーム長 ( =52 )
k :ベクトルの要素番号
Figure imgf000039_0001
(23) scr2: 2番目雑音べクトル本選択基準値
cscr2: (数 25) により前もって計算しておいた定数
SYNOstbl(slpsel(jl),k) :直交化合成 1番目雑音べクトル
SYNOstb2(s2psel(j2),k) :直交化合成 2番目雑音べクトル
r(k) :ターゲットべクトル
slpsel(jl) : 1番目雑音ベクトル予備選択後インデクス
s2psel(j2) : 2番目雑音ベクトル予備選択後インデクス
Ns:サブフレーム長 ( =52 )
k:べクトルの要素番号
ただし、 (数式 22) 中の c s 1 c rおよび(数式 23) 中の c s 2 c rは、 それぞれ (数式 24) および (数式 25) によりあらかじめ計算しておいた定 数である。
Ns - 1 Ns - 1
csc rl= 2) SYNOstbl(slpsel(jl), k) x r(k) + SYNOstb2(s2psel(j2), k) x r(k)
(24)
cscrl: (数 29) 用定数
SYNOstbl(slpsel(jl),k) :直交化合成 1番目雑音べクトル
SYNOstb2(s2psel(j2),k) :直交化合成 2番目雑音べクトル
r(k) : 夕一ゲットべクトル
slpsel(jl) : 1番目雑音ベクトル予備選択後インデクス
s2psel(j2) : 2番目雑音ベクトル予備選択後インデクス W 82083 TJP 7
38
Ns:サブフレーム長 ( =52 )
k:べクトルの要素番号
Ns-l Ns-1
csc rl= 2 SYNOstbl(slpsel(jl), k) x r(k) - J SYNOstb2(s2psel(j2), k) x r(k)
k=0 K=0
(25) cscr2: (数 23) 用定数
SYNOstbl(slpsel(jl),k) :直交化合成 1番目雑音べクトル
SYNOstb2(s2psel(j2),k) :直交化合成 2番目雑音べクトル
r(k) : 夕ーゲットべクトル
slpsel(jl) : 1番目雑音ベクトル予備選択後インデクス
s2psel(j2) : 2番目雑音ベクトル予備選択後インデクス
Ns:サブフレーム長 ( =52 )
k:べクトルの要素番号
比較部 B 1330は、 さらに、 s 1 c rの最大値を MAX s 1 c rに代入し、 s 2 c rの最大値を MAX s 2 c rに代入し、 MAX s 1 c rと MAX s 2 c rの大きい方を s c rとし、 s c rが得られた時に参照していた s 1 s e 1 (j 1) の値を 1番目雑音ベクトル本選択後インデクス SS EL Iとしてパラ メータ符号化部 1331へ出力する。 S SEL 1に対応した雑音べクトルを本 選択後 1番目雑音ベクトル P s t b 1 (SSEL 1, k) として保存し、 P s t b 1 (S SEL 1, k) に対応した本選択後合成 1番目雑音ベクトル SYN s t b l (SSEL 1, k) ( 0≤ k≤N s— 1 ) を求めてパラメ一夕符号化 部 1331へ出力する。
同様に、 s c rが得られた時に参照していた s 2 p s e 1 (j 2) の値を 2 番目雑音べクトル本選択後ィンデクス SSEL2としてパラメ一夕符号化部 1 331へ出力し、 SSEL 2に対応した雑音ベクトルを本選択後 2番目雑音べ クトル P s t b 2 (S SEL 2, k) として保存し、 P s t b 2 (S SEL 2, k)に対応した本選択後合成 2番目雑音ベクトル SYNs t b 2 (SSEL 2, k) (0≤k≤N s - 1) を求めてパラメ一夕符号化部 1331へ出力する。 比較部 B 1330は、 さらに、 P s t b 1 (S SEL 1, k) と P s t b 2 (S SEL 2, k) それぞれに乗じる符号 S 1と S 2を (数式 26) によって 求め、 求めた S 1と S 2の正負情報をゲイン正負インデクス I s 1 s 2 (2 b i t s情報) としてパラメータ符号化部 1331へ出力する。
(+1,+1) scrl≥ scr2,cscrl≥ 0
(-1,-1) scrl≥ scr2,cscrl < 0 . „ .
(S1,S2) (26)
(+1,-1) scrlく scr2, cscr2≥ 0
- 1,+ 1) scr 1 < scr2, cscr2 < 0
SI :本選択後 1番目雑音べクトルの符号
S2 :本選択後 2番目雑音べクトルの符号
scrl: (数 29) の出力
scr2: (数 23) の出力
cscrl : (数 24) の出力
cscr2: (数 25) の出力
(数式 27) によって雑音ベクトル ST (k) (0≤k≤Ns - 1) を生成 して適応符号帳更新部 1333へ出力するとともに、 そのパヮ POWs f を求 めてパラメ一夕符号化部 1331へ出力する。
ST(k) = SI X Pstbl(SSELl, k)+S2x Pstb2(SSEL2, k) (27)
ST(k) :確率的べクトル
SI :本選択後 1番目雑音べクトルの符号
S2 :本選択後 2番目雑音べクトルの符号
PstbKSSELl.k) :本選択後 1段目確定的べクトル
Pstbl(SSEL2,k) :本選択後 2段目確定的ベクトル SSEL1: 1番目雑音べクトル本選択後インデクス
SSEL2: 2番目雑音べクトル本選択後インデクス
k:べクトルの要素番号( 0 ≤ k ≤ Ns - 1 )
(数式 28) によって合成雑音ベクトル S YN s t (k) (0≤k≤Ns - 1) を生成してパラメータ符号化部 1331へ出力する。
SYNst(k) = SI X SYNstbl(SSELl, k) + S2x SYNstb2(SSEL2, k) (28)
STNst(k) :合成確率的べクトル
S1:本選択後 1番目雑音べクトルの符号
S2:本選択後 2番目雑音べクトルの符号
SYNstbKSSELl.k) :本選択後合成 1番目雑音べクトル
SYNstb2(SSEL2,k) :本選択後合成 2番目雑音べクトル
k:べクトルの要素番号( 0 ≤ k≤ Ns - 1 )
パラメ一夕符号化部 1331は、 まず、 フレームパヮ量子化 ·復号部 130
2において求めた復号化フレームパヮ s pow、 ピッチ予備選択部 1308に おいて求めた正規化予測残差パヮ r e s i dを用いた (数式 29) によりサブ フレーム推定残差パヮ r sを求める。
rs = Ns X spow x resia (29)
rs :サブフレーム推定残差パヮ
Ns :サブフレーム長 (=52)
spow :復号化フレームパヮ
resid :正規化予測残差パヮ
求めたサブフレーム推定残差パヮ r s、 比較部 Al 322において計算した 適応 固定べクトルのパヮ POWa f、 比較部 B 1330において求めた雑音 べクトルのパヮ P OW s t;、 (表 7 ) に示すゲイン量子化テーブル格納部 13 32に格納された 256wo r d sのゲイン量子化用テーブル(C G a f [ i ] , CGs t [ i] ) (0≤ i≤127) などを用いて、 (数式 30) により量子 化ゲイン選択基準値 S TD gを求める <
Figure imgf000043_0001
rs
•CGaf(Ig)xSYNaf(k)
STDg
rs
x SYNst{k) - r{k)
POWst
(30)
Srog:量子化ゲイン選択基準値
rs:サブフレーム推定残差パヮ
尸 適応 /固定べクトルのパヮ
:雑音べクトルのパヮ
:ゲイン量子化テーブルのインデクス (0 ≤i'≤127)
CGa :ゲイン量子化テーブルの適応 固定べクトル側成分
(り:ゲイン量子化テーブルの雑音べクトル側成分
■SiWfl /( ):合成適応/固定べクトル
S V5i()t):合成雑音べクトル
):ターゲットべクトリレ
Ns:サブフレーム長 (= 5 2)
:べクトルの要素番号 (0 ≤ k≤Ns-l) 求めた量子化ゲイン選択基準値 S TD gが最小となる時のィンデクスをゲイ ン量子化インデクス I gとして 1つ選択し、 選択したゲイン量子化インデクス I gをもとにゲイン量子化用テ一ブルから読み出した適応 Z固定べクトル側選 択後ゲイン CGa f ( I g) 、 選択したゲイン量子化インデクス I gをもとに ゲイン量子化用テーブルから読み出した雑音べクトル側選択後ゲイン CG s t
( I g) 、 などを用いた (数式 3 1) により、 AF (k) に実際に適用する適 応 Z固定ベクトル側本ゲイン G a fおよび ST (k) に実際に適用する雑音べ クトル側本ゲイン G s tを求めて適応符号帳更新部 1 3 3 3へ出力する。
I I e 、
(Gaf,Gst ~ - ·~ CGaf(Ig), — -"" CGst(IG) (31) 、 ゾ ノ 、 尸 OPFfl/ J 6 f POWst 、 ノ 、 ノ 適応 固定べク トル側本ゲイン
雑音べク トル側本ゲイン
:サブフレーム推定残差パヮ
尸 O 《/:固定 ·適応側べク トルのパヮ
尸 OW¾t:雑音べク トルのパヮ
CGfl/(/g):固定 ·適応側べク トルのパヮ
C(¾t(/g):雑音べク トル側選択後ゲイン
:ゲイン量子化ィンデクス
パラメ一夕符号化部 1 3 3 1は、 フレームパヮ量子化 ·復号部 1 3 02にお いて求めたパワインデクス I p ow、 し3 ?量子化'復号化部1 3 0 6におい て求めた L S P符号 I 1 s p、 適応 Z固定選択部 1 3 20において求めた適応 /"固定インデクス AF SEL、 比較部 B 1 3 3 0において求めた 1番目雑音べ クトル本選択後インデクス S S EL 1と 2番目雑音べクトル本選択後インデク ス S S EL 2とゲイン正負インデクス I s 1 s 2、 パラメ一夕符号化部 1 3 3 1自身において求めたゲイン量子化インデクス I gをまとめて音声符号とし、 まとめた音声符号を伝送部 1 3 34へ出力する。
適応符号帳更新部 1 3 3 3は、 比較部 A 1 3 2 2において求めた適応 固定 べクトル AF (k) と比較部 B 1 3 30において求めた雑音べクトル ST (k) に、 パラメ一夕符号化部 1 3 3 1で求めた適応 固定べクトル側本ゲイン G a f と雑音べクトル側本ゲイン Gs tをそれぞれ乗じた後に加算する(数式 32) の処理を行って駆動音源 e X (k) (0≤k≤Ns - l ) を生成し、 生成した 駆動音源 e x (k) (0≤k≤Ns - 1) を適応符号帳 1318に出力する。 ex{k) = Gaf x AF{k) + Gst x ST(k) (32)
( ):駆動音源
(ん):適応 z固定べク トル
):雑音べク トルのゲイン
:ベク トルの要素番号 (0≤ t≤ Ns -l)
この時、 適応符号帳 1318内の古い駆動音源は破棄され、 適応符号帳更新 部 1333より受けた新しい駆動音源 e X (k) で更新されることになる。
(実施の形態 8)
次に、 ディジ夕ル携帯電話における音声符号化ノ復号化標準方式である P S I—CE LPで開発した音声複号化装置に、 上述した実施の形態 1〜実施の形 態 6で説明した音源べクトル生成装置を適用した実施の形態について説明する。 この復号化装置は、 前述の実施の形態 7と対を成す装置である。
図 14に実施の形態 8にかかる音声復号化装置の機能プロック図が示されて いる。 パラメ一夕複号化部 1402は、 図 13に記載した CE LP型音声符号 化装置から送られた音声符号(パワインデクス I pow、 3?符号1 1 s p、 適応 Z固定インデクス AFSEL、 1番目雑音べクトル本選択後インデクス S SEL 1、 2番目雑音ベクトル本選択後インデクス SSEL 2、 ゲイン量子化 インデクス I g、 ゲイン正負インデクス I s 1 s 2) を伝送部 1401を通し て獲得する。
次に、 パヮ量子化テーブル格納部 1405に格納されたパヮ量子化用テープ ル (表 3参照) からパワインデクス I P owの示すスカラー値を読み出し復号 化フレームパヮ s p owとしてパヮ復元部 1417へ出力し、 L S P量子化テ —ブル格納部 1404に格納された LSP量子化用テーブルから LSP符号 I 1 s pの示すべクトルを読み出し復号化 LSPとして LSP補間部 1406へ 出力する。 適応 Z固定インデクス AFSELを適応べクトル生成部 1408と 固定べクトル読み出し部 141 1と適応 固定選択部 1412へ出力し、 1番 目雑音べクトル本選択後インデクス S SEL 1と 2番目雑音べクトル本選択後 インデクス S SEL 2を音源べクトル生成装置 1414へ出力する。 ゲイン量 子化テーブル格納部 1403に格納されたゲイン量子化用テーブル (表 7参照) からゲイン量子化インデクス I gの示すベクトル (CAa f ( I g) , CGs t (I g) ) を読み出し、 符号化装置側と同様、 (数式 31) により AF (k) に実際に適用する適応 固定ベクトル側本ゲイン G a fおよび ST (k) に実 際に適用する雑音べクトル側本ゲイン G s tを求め、 求めた適応 固定べクト ル側本ゲイン G a f と雑音べクトル側本ゲイン G s tをゲイン正負ィンデクス I s 1 s 2とともに駆動音源生成部 1413へ出力する。
3 補間部1406は、 符号化装置と同じ方法で、 パラメ一夕複号化部 1 402より受けた復号化 LSPから復号化補間 LSPco i n t p (n, i) (1 ≤ i≤Np) をサブフレーム毎に求め、 求めた ω i n t p (n, i ) を LPC に変換することで復号化補間 L P Cを得、 得られた復号化補間 L P Cを L P C 合成フィルタ部 1413へ出力する。
適応べクトル生成部 1408は、 パラメ一夕復号化部 1402より受けた適 応 Z固定インデクス AFSELに基づき、 適応符号帳 1407から読み出した べクトルにポリフェーズ係数格納部 1409に格納されたポリフェーズ係数 (表 5参照) の一部を畳みこんで分数ラグ精度の適応ベクトルを生成し、 適応 /固定選択部 1412へ出力する。 固定べクトル読み出し部 141 1は、 パラ メータ複号化部 1402より受けた適応 Z固定インデクス AFSELに基づき、 固定符号帳 1410から固定べクトルを読み出して適応 固定選択部 1412 へ出力する。
適応 Z固定選択部 1412は、 パラメ一夕復号化部 1402より受けた適応 ノ固定インデクス AFSELに基づき、 適応べクトル生成部 1408から入力 された適応べクトルと固定べクトル読み出し部 141 1から入力された固定べ クトルのどちらか一方のベクトルを選択して適応 固定ベクトル AF (k) と し、 選択した適応ノ固定ベクトル AF (k) を駆動音源生成部 1413へ出力 する。 音源ベクトル生成装置 1414は、 パラメ一夕復号化部 1402より受 けた 1番目雑音べクトル本選択後インデクス S SEL 1と 2番目雑音べクトル 本選択後ィンデクス S S E L 2に基づき、 シ一ド格納部 71から 1番目シード 及び 2番目シードを取出して非線形ディジタルフィル夕 72に入力して 1番目 雑音べクトルと 2番目雑音べクトルをそれぞれ発生させる。 このようにして再 生した 1番目雑音べクトルと 2番目雑音べクトルそれぞれにゲイン正負インデ クスの 1段目情報 S 1と 2段目情報 S 2を乗じて音源ベクトル ST (k) を生 成し、 生成した音源べクトルを駆動音源生成部 1413へ出力する。
駆動音源生成部 1413は、 適応ノ固定選択部 1412から受けた適応 固 定ベクトル AF (k) と音源ベクトル生成装置 1414から受けた音源べクト ル ST (k) に、 パラメ一夕復号化部 1402で求めた適応 Z固定ベクトル側 本ゲイン G a f と雑音べクトル側本ゲイン G s tをそれぞれ乗じ、 ゲイン正負 インデクス I s 1 s 2に基づき加算もしくは減算して駆動音源 e X (k)を得、 得られた駆動音源を LP C合成フィルタ部 1413と適応符号帳 1407へ出 力する。 ここで、 適応符号帳 1407内の古い駆動音源は、 駆動音源生成部 1 413から入力された新しい駆動音源で更新される。
L PC合成フィル夕部 1413は、 駆動音源生成部 1413で生成した駆動 音源に対し、 L S P補間部 1406より受けた復号化補間 LP Cで構成した合 成フィル夕を用いて L P C合成を行い、 フィルタの出力をパヮ復元部 1 4 1 7 へ出力する。 パヮ復元部 1 4 1 7は、 まず、 L P C合成フィル夕部 1 4 1 3で 求めた駆動音源の合成ベクトルの平均パヮを求め、 次に、 パラメ一夕復号化部 1 4 0 2より受けた復号化パヮ s p o wを求めた平均パヮで除算し、 除算結果 を駆動音源の合成べクトルに乗じて合成音 5 1 8を生成する。
(実施の形態 9 )
図 1 5は、実施の形態 9による音声符号化装置の主要部のプロック図である。 この音声符号化装置は、 図 1 3に示す音声符号化装置に量子化対象 L S P追加 部 1 5 1、 L S P量子化 ·複号化部 1 5 2、 L S P量子化誤差比較部 1 5 3を 追加又は機能の一部変更を加えたものである。
し (:分析部1 3 0 4は、 バッファ 1 3 0 1内の処理フレームに対して線形 予測分析を行って L P Cを得、 得た L P Cを変換して量子化対象 L S Pを生成 し、 生成した量子化対象 L S Pを量子化対象 L S P追加部 1 5 1へ出力する。 特に、 バッファ内の先読み区間に対して線形予測分析を行って先読み区間に対 する L P Cを得、 得られた L P Cを変換して先読み区間に対する L S Pを生成 して量子化対象 L S P追加部 1 5 1へ出力する機能を併せ持つ。
量子化対象 L S P追加部 1 5 1は、 し?〇分析部1 3 0 4において処理フレ ームの L P Cを変換することで直接的に得られた量子化対象 L S P以外に、 複 数の量子化対象 L S Pを生成する。
L S P量子化テーブル格納部 1 3 0 7は、 L S P量子化 ·復号化部 1 5 2が 参照する量子化テーブルを格納し、 L S P量子化 ·複号化部 1 5 2は、 生成さ れた量子化対象 L S Pを量子化 ·復号化し、 それぞれの復号化 L S Pを生成す る。
L S P量子化誤差比較部 1 5 3は、 生成した複数の複号化 L S Pを比較し、 最も異音が少なくなる複号化 L S Pをクローズドループで 1つ選択し、 選択し た複号化 L S Pを処理フレームに対する復号化 L S Pとして新たに採用するも のである。
図 16に、 量子化対象 LSP追加部 151のブロック図を示す。
量子化対象 L S P追加部 151は、 LP C分析部 1304において求めた処 理フレームの量子化対象 LSPを記憶する現フレーム LSP記憶部 161と、 ?(:分析部1304において求めた先読み区間の L S Pを記憶する先読み区 間 LSP記憶部 162と、 前処理フレームの復号化 LSPを記憶する前フレー ム LSP記憶部 163と、 上記 3つの記憶部から読み出した LSPに対して線 形補間計算を行い量子化対象 L S Pを複数個追加する線形補間部 164によつ て構成されている。
処理フレームの量子化対象 L S Pと先読み区間の L S Pと前処理フレームの 複号化 L S Pに対して線形補間計算を行うことで、 量子化対象 L S Pを複数個 追加生成し、 生成した量子化対象 LSPを全て LSP量子化 '復号化部 152 へ出力する。
ここで、 量子化対象 LSP追加部 151について、 さらに詳しく説明する。 ?( 分析部1304力 バッファ内の処理フレームに対して線形予測分析を 行い予測次数 Np (=10) 次の LPCひ ( i ) (1≤ i≤Np) を得、 得ら れた LPCを変換して量子化対象 LSPc ( i) (1≤ i≤Np) を生成し、 生成した量子化対象 LSPo ( i) (1≤ i≤Np) を量子化対象 LSP追加 部 151内の現フレーム L S P記憶部 161へ格納する。 さらにバッファ内の 先読み区間に対して線形予測分析を行って先読み区間に対する LP Cを得、 得 られた LP Cを変換して先読み区間に対する LSPco f ( i ) (1≤ i≤Np) を生成し、 生成した先読み区間に対する LSPco ί ( i) (1≤ i≤Np) を 量子化対象 LSP追加部 151内の先読み区間 LSP記憶部 162へ格納する。 次に、 線形補間部 164が、 現フレーム LSP記憶部 161から処理フレー ムに対する量子化対象 L S P o ( i ) (l≤ i≤Np) を、 先読み区間 L S P 記憶部 1 6 2から先読み区間に対する L S Pc f ( i ) (1≤ i≤Np) を、 前フレーム L S P記憶部 1 6 3から前処理フレームに対する複号化 L S Ρω q p ( i ) ( 1≤ i≤Np) をそれぞれ読み出し、 (数式 3 3) に示した変換を 行うことによって、 量子化対象追加第 1 L S P ω 1 ( i ) (1≤ i≤Np) , 量子化対象追加第 2 L S Pco 2 ( i ) (1≤ i≤Np) 、 量子化対象追加第 3 L S Pco 3 ( i ) (1≤ i≤Np) をそれぞれ生成する。
ω 1(ί) ■0.8 0.2 0.0· 'ω<?( '
ω 2(i) 0.5 0.3 0.2 ω qp(i) (33)
ω 3(i) 0.8 0.3 0.5
ω l(i'):量子化対象追加第 1 LSP
ω 2(ί):量子化対象追加第 2 LSP
ω 3(/):量子化対象追加第 3 LSP
Figure imgf000050_0001
N/^ PC分析次数(= 10)
ω q(i) 処理フレームに対する複号化 ^P
ω qp(i) 前処理フレームに対する複合化 S
ω/ ):先読み区間に LSP 生成した ω ΐ ( Π 、 ω 2 ( ί) 、 ω 3 ( Π を L S P量子化 ·複号化部 1 5 2へ出力し、 L S P量子化 ·復号化部 1 5 2が、 4つの量子化対象 L S Pco
( i ) , ω ΐ ( i ) , ω 2 ( i ) , ω 3 ( i ) を全てベクトル量子化 ·複号化 した後に、 ω ( i ) に対する量子化誤差のパヮ E p ow (ω) 、 ω ΐ ( i ) に 対する量子化誤差のパヮ E p ow (ω 1) 、 ω 2 ( i ) に対する量子化誤差の パヮ E p ow (ω 2) 、 および ω 3 ( i ) に対する量子化誤差のパヮ E p ow
(ω 3) をそれぞれ求め、 求めたそれぞれの量子化誤差パヮに対して (数式 3 4) の変換を施して復号化 L S P選択基準値 STD 1 s ρ (ω) , STD I s ρ (ω 1) , STD 1 s ρ (ω 2) , および STD 1 s p (ω 3) を求める。 STDlsp{ ω ) Epow( ω ) 0.0010
Epow( ω 1) 0.0005
(34)
STDlsp{ ω 2) Epow{ ω 2) 0.0002
STDlsp( ω 3) Epow{ ω 3) 0.0000
S 7(ω): ω (りに対する複合ィ bL 選択基準値
STDlsp{ ω 1): ω 1( に対する複合 ibL尸選択基準値
STDlsp{ ω 2): ω 2(i)に対する複合 it S尸選択基準値
STDlsp( ω 3): ω 3( に対する複合 itZSP選択基準値
Epow( ω):ω (i)に対する量子化誤差のパヮ
Figure imgf000051_0001
ω1(ζ·)に対する量子化誤差のパヮ
Epow( ω 2): ω 2( に対する量子化誤差のパヮ
Epow( ω3):ω 3(i)に対する量子化誤差のパヮ
求めた複号化 L S P選択基準値を比較して、 その値が最小となるような量子 化対象 L S Pに対する復号化 L S Pを処理フレームに対する複号化 L S P ω Q ( i ) (1≤ i≤Np) として選択 '出力するとともに、 次フレームの LSP をべクトル量子化する際に参照できるよう、 前フレーム LSP記憶部 163に 格納する。
本実施の形態は、 LSPの有する補間特性の高さ (補間した LSPを用いて 合成しても、 異音が起こらない) を有効に利用し、 語頭のようにスペクトルが 大きく変動する区間に対しても異音が生じないように L SPをべクトル量子化 できるようにするもので、 LS Pの量子化特性が不十分になった場合に生じる 可能のある合成音中の異音を低減することができる。
また、 図 17に、 本実施の形態における L S P量子化 ·復号化部 152のプロ ック図を示す。 L S P量子化 ·復号化部 152は、 ゲイン情報格納部 171、 適応ゲイン選択部 172、 ゲイン乗算部 173、 LS P量子化部 174、 LS P複号化部 115を備えている。
ゲイン情報格納部 171は、 適応ゲイン選択部 172において適応ゲインを 選択する際に参照する複数のゲイン候補を格納する。 ゲイン乗算部 173は、 LSP量子化テーブル格納部 1307より読み出したコードべクトルに、 適応 ゲイン選択部 172において選択した適応ゲインを乗じる。 LSP量子化部1 74は、 適応ゲインを乗じたコードべクトルを用いて量子化対象 L S Pをべク トル量子化する。 し3?復号化部175は、 ベクトル量子化した LSPを復号 化して復号化 L S Pを生成 ·出力する機能と、 量子化対象 L S Pと復号化 L S Pの差分である LSP量子化誤差を求めて適応ゲイン選択部 1 72へ出力する 機能とを有する。 適応ゲイン選択部 172は、 前処理フレームの LSPをべク トル量子化した時にコードべクトルに乗じた適応ゲインの大きさと前フレーム に対する L S P量子化誤差の大きさを基準にして、 処理フレームの量子化対象 LSPをべクトル量子化する時にコードべクトルに乗じる適応ゲインを、 ゲイ ン格納部 171に格納されたゲイン生成情報をもとに適応的に調節しながら求 め、 求めた適応ゲインをゲイン乗算部 173に出力する。
このように L S P量子化 ·復号化部 152はコードべクトルに乗じる適応ゲ インを適応的に調節しながら、 量子化対象 L S Pをべクトル量子化および復号 化するものである。
ここで、 LSP量子化 ·復号化部 152について、 さらに詳しく説明する。 ゲイン情報格納部 171は、 適応ゲイン選択部 103が参照する 4つのゲイン 候補 (0. 9, 1. 0, 1. 1, 1. 2) を格納しており、 適応ゲイン選択部 103は、 前フレームの量子化対象 LSPを量子化した際に生じたパヮ ERp owを、 前処理フレームの量子化対象 LSPをべクトル量子化した時に選択し た適応ゲイン Gq 1 s pの 2乗で除算する (数式 35) 式により、 適応ゲイン 選択基準値 S 1 s pを求める。
Figure imgf000053_0001
Slsp: 適応ゲイン選択基準値
ERpow : 前フレームの ^尸を量子化した際に
生じた量子化誤差のパヮ
Gqlsp: 前フレームの 尸を量子化の際に
選択した適応ゲイン 求めた適応ゲイン選択の基準値 S 1 s pを用いた (数式 36) によって、 ゲ イン情報格納部 1 7 1より読み出した 4つのゲイン候補 (0. 9, 1. 0, 1.
1, 1, 2) から 1つのゲインを選択する。 そして、 選択した適応ゲイン GQ
1 s pの値をゲイン乗算部 173へ出力すると共に、 選択した適応ゲインが 4 種類のうちのどれなのかを特定するための情報 (2ビット情報) をパラメ一夕 符号化部へ出力する。
Figure imgf000053_0002
(36)
Glsp: Z^P量子化用コードべクトルに乗じる適応ゲイン
Slsp:適応ゲイン選択基準値
選択した適応ゲイン G l s pおよび量子化に伴い生じた誤差を、 次フレーム の量子化対象 LSPをベクトル量子化する時まで、 変数 Gq 1 s pおよび変数 ERp owに保存しておく。
ゲイン乗算部 173は、 L S P量子化テーブル格納部 1307より読み出し たコードべクトルに適応ゲイン選択部 172において選択した適応ゲイン G 1 s pを乗じて LSP量子化部 174へ出力する。 乙3?量子化部174は、 適 応ゲインを乗じたコ一ドべクトルを用いて量子化対象 L S Pをべクトル量子化 してそのインデクスをパラメ一夕符号化部へ出力する。 3?復号化部175 は、 L S P量子化部 174で量子化した L S Pを復号化して復号化 L S Pを得、 得られた復号化 L S Pを出力するとともに、 得られた復号化 L S Pを量子化対 象し S Pから減算して L S P量子化誤差を求め、 求めた L S P量子化誤差のパ ヮ ERp owを計算して適応ゲイン選択部 172へ出力する。
本実施の形態は、 L S Pの量子化特性が不十分になった場合に生じる可能の ある合成音中の異音を低減することができる。
(実施の形態 10)
図 18は本実施の形態における音源べクトル生成装置の構成ブロックを示す。 この音源ベクトル生成装置は、 チャネル CHI, CH2, CH3の 3個の固定 波形 (V 1 (長さ: LI) 、 V 2 (長さ: L2) 、 V 3 (長さ: L3) ) を格納する 固定波形格納部 181と、 各チャネルにおける固定波形始端候補位置情報を有 し、 固定波形格納部 181から読み出した固定波形 (Vl、 V2、 V3) をそ れぞれ Pl、 P2、 P3の位置に配置する固定波形配置部 182と、 固定波形配置部 182によって配置された固定波形を加算して音源べクトルを出力する加算部 183とを備えている。
以上のように構成された音源べクトル生成装置の動作について説明する。 固定波形格納部 181には 3個の固定波形 VI、 V2、 V3が予め格納され ている。 固定波形配置部 182は、 (表 8) に示すような自らが有する固定波 形始端候補位置情報に基づいて、 固定波形格納部 181から読み出した固定波 形 VIを CH1用の始端候補位置から選択した位置 P1に配置 (シフト) し、 同 様に、 固定波形 V2、 V3を CH2、 CH3用の始端候補位置から選択した位 置 P2、 P3にそれぞれ配置する。
表 8
Figure imgf000055_0001
加算部 1 8 3は、 固定波形配置部 1 8 2によって配置された固定波形を加算 して音源べク トルを生成する。
ただし、 固定波形配置部 1 8 2が有する固定波形始端候補位置情報には、 選 択されうる各固定波形の始端候補位置の組合せ情報 (P1としてどの位置が選択 され、 Ρ2としてどの位置が選択され、 Ρ3としてどの位置が選択されたかを表す 情報) と一対一に対応するコード番号を割り当てておくこととする。
このように構成された音源べク トル生成装置によれば、 固定波形配置部 1 8 2が有する固定波形始端候補位置情報と対応関係のあるコード番号の伝送によ つて音声情報の伝送を行うことが可能となるとともに、 コード番号は各始端候 補数の積の分だけ存在することになり、計算や必要メモリをあまり増やさずに、 実音声に近い音源べク トルの生成が可能となる。
また、 コ一ド番号の伝送によつて音声情報の伝送を行うことが可能となるた め、 上記音源べク トル生成装置を、 雑音符号帳として音声符号化/複号化装置 に用いることが可能となる。
なお、 本実施の形態では、 図 1 8に示すように 3個の固定波形を用いる場合 について説明したが、 固定波形の個数 (図 18および (表 81) のチャネル数 と一致する) をその他の個数にした場合にも同様の作用 ·効果が得られる。 また、 本実施の形態では、 固定波形配置部 182が、 (表 8) に示す固定波 形始端候補位置情報を有する場合について説明したが、 (表 8) 以外の固定波 形始端候補位置情報を有する場合についても、 同様の作用,効果が得られる。
(実施の形態 1 1)
図 19 Aは本実施の形態にかかる C E L P型音声符号化装置の構成プロック 図であり、 図 19 Bは CELP型音声符号化装置と対になる CE LP型音声復 号化装置の構成ブロック図である。
本実施の形態にかかる CE LP型音声符号化装置は、 固定波形格納部 181 Aと固定波形配置部 182 A及び加算器 183 Aからなる音源べクトル生成装 置を備える。 固定波形格納部 181 Aは複数本の固定波形を格納し、 固定波形 配置部 182 Aは自ら有する固定波形始端候補位置情報に基づいて、 固定波形 格納部 181 Aから読み出した固定波形をそれぞれ選択した位置に配置 (シフ ト) し、 加算器 183 Aは固定波形配置部 182 Aによって配置された固定波 形を加算して音源べクトル Cを生成する。
また、 この CE LP型音声符号化装置は、 入力される雑音符号帳探索用ター ゲット Xを時間逆順化する時間逆順化部 191、 時間逆順化部 191の出力を 合成する合成フィル夕 192、 合成フィル夕 192の出力を再度時間逆順化し て時間逆合成ターゲット X' を出力する時間逆順化部 193、 雑音符号べクト ルゲイン gcを乗じた音源べクトル Cを合成して合成音源べクトル Sを出力する 合成フィルタ 194、 X' 、 C、 Sを入力して歪みを計算する歪み計算部 20 5、 及び伝送部 196を有している。
本実施の形態では、 固定波形格納部 181 A、 固定波形配置部 182 A、 及 び加算部 183 Aは、 図 18に示す固定波形格納部 181、 固定波形配置部 1 8 2、 及び加算部 1 8 3と対応するものとし、 各チャネルにおける固定波形始 端候補位置は (表 8 ) に対応するものとして、 以下、 チャネル番号、 固定波形 番号とその長さ及び位置を示す記号は図 1 8及び (表 8 ) に示すものを使用す る。
一方、 図 1 9 Bの C E L P型音声復号化装置は、 複数本の固定波形を格納す る固定波形格納部 1 8 1 B、自ら有する固定波形始端候補位置情報に基づいて、 固定波形格納部 1 8 1 Bから読み出した固定波形をそれぞれ選択した位置に配 置 (シフト) する固定波形配置部 1 8 2 B、 固定波形配置部 1 8 2 Bによって 配置された固定波形を加算して音源べクトル Cを生成する加算部 1 8 3 B、 雑 音符号べクトルゲイン gcを乗じるゲイン乗算部 1 9 7、 音源べクトル Cを合成 して合成音源べクトル Sを出力する合成フィル夕 1 9 8を備えている。
音声復号化装置における固定波形格納部 1 8 1 B及び固定波形配置部 1 8 2 Bは、 音声符号化装置における固定波形格納部 1 8 1 A及び固定波形配置部 1 8 2 Bと同じ構成を有し、 固定波形格納部 1 8 1 A及び 1 8 1 Bが格納する固 定波形は、 雑音符号帳探索用ターゲットを用いた (数式 3 ) の符号化歪みの計 算式をコスト関数とした学習により、 (数式 3 ) のコスト関数を統計的に最小 化するような特性を有する固定波形であるものとする。
以上のように構成された音声符号化装置の動作を説明する。
雑音符号帳探索用ターゲット Xは、 時間逆順化部 1 9 1で時間逆順化された 後、 合成フィル夕 1 9 2で合成され、 再度時間逆順化部 1 9 3で時間逆順化さ れ、 雑音符号帳探索用の時間逆合成ターゲット X ' として歪み計算部 2 0 5へ 出力される。
次に、 固定波形配置部 1 8 1 Aが、 (表 8 ) に示す自らが有する固定波形始 端候補位置情報に基づいて、 固定波形格納部 1 8 1 Aから読み出した固定波形 V Iを C H 1用の始端候補位置から選択した位置 P1に配置 (シフト) し、 同様 に、 固定波形 V 2、 V 3を C H 2、 C H 3用の始端候補位置から選択した位置 P 2、 P3にそれぞれ配置する。配置された各固定波形は、加算器 1 8 3 Aに出力さ れ、 加算されて音源ベクトル Cとなり、 合成フィル夕部 1 9 4に入力する。 合 成フィルタ 1 9 4は、音源べクトル Cを合成して合成音源べクトル Sを生成し、 歪み計算部 2 6へ出力する。
歪み計算部 2 0 5は、 時間逆合成ターゲット X ' 、 音源ベクトル (:、 合成音 源ベクトル Sを入力し、 (数式 4 ) の符号化歪みを計算する。
歪み計算部 2 0 5は、 歪みを計算した後、 固定波形配置部 1 8 1 Aへ信号を 送り、 固定波形配置部 1 8 2 Aが 3個のチャネルそれぞれに対応する始端候補 位置を選択してから歪み計算部 2 0 5で歪みを計算するまでの上記処理を、 固 定波形配置部 1 8 2 Aが選択しうる始端候補位置の全組合せについて繰り返し 行う。
その後、 符号化歪みが最小化される始端候補位置の組合せを選択し、 その始 端候補位置の組合せと一対一に対応するコード番号、 及びその時の最適な雑音 符号べクトルゲイン gcを、 雑音符号帳の符号として伝送部 1 9 6へ伝送する。 次に、 図 1 9 Bの音声復号化装置の動作を説明する。
固定波形配置部 1 8 1 Bは、伝送部 1 9 6から送られてくる情報に基づいて、 (表 8 ) に示す自らが有する固定波形始端候補位置情報から各チャネルにおけ る固定波形の位置を選択し、 固定波形格納部 1 8 1 Bから読み出した固定波形 V Iを C H 1用の始端候補位置から選択した位置 P1に配置 (シフト) し、 同様 に、 固定波形 V 2、 V 3をC H 2、 C H 3用の始端候補位置から選択した位置 P 2、 P3にそれぞれ配置する。配置された各固定波形は、加算器 4 3に出力され、 加算されて音源べクトル Cとなり、 伝送部 1 9 6からの情報により選択された 雑音符号ベクトルゲイン gcを乗じて、 合成フィルタ 1 9 8へ出力される。 合成 フィル夕 1 9 8は、 gcを乗じた音源べクトル Cを合成して合成音源べクトル S を生成し、 出力する。
このように構成された音声符号化装置 Z復号化装置によれば、 音源べクトル が固定波形格納部、 固定波形配置部、 及び加算器からなる音源ベクトル生成部 によって生成されるため、 実施の形態 1 0の効果を有することに加え、 この音 源べクトルを合成フィル夕で合成した合成音源べクトルが、 実際の夕一ゲット と統計的に近い特性を持つこととなり、 品質の高い合成音声を得ることができ る。
なお、 本実施の形態では、 学習によって得られた固定波形を固定波形格納部 1 8 1 A及び 1 8 1 Bに格納する場合を示したが、 その他、 雑音符号帳探索用 夕一ゲット Xを統計的に分析し、 その分析結果に基づいて作成した固定波形を 用いる場合や、 知見に基づいて作成した固定波形を用いる場合にも、 同様に品 質の高い合成音声を得ることができる。
また、 本実施の形態では、 固定波形格納部が 3個の固定波形を格納する場合 について説明したが、 固定波形の個数をその他の個数にした場合にも同様の作 用 ·効果が得られる。
また、 本実施の形態では、 固定波形配置部が (表 8 ) に示す固定波形始端候 補位置情報を有する場合について説明したが、 (表 8 ) 以外の固定波形始端候 補位置情報を有する場合についても、 同様の作用 ·効果が得られる。
(実施の形態 1 2 )
図 2 0は本実施の形態にかかる C E L P型音声符号化装置の構成プロック図 を示す。
この C E L P型音声符号化装置は、 複数本の固定波形 (本実施の形態では、 C H 1 : W l、 C H 2 : W 2、 C H 3 : W 3の 3個) を格納する固定波形格納 部 2 0 0と、 固定波形格納部 2 0 0に格納された固定波形の始端位置について 代数的規則により生成するための情報である固定波形始端候補位置情報を有す る固定波形配置部 201とを有している。 また、 この CE LP型音声符号化装 置は、 波形別インパルス応答算出部 202、 インパルス発生器 203、 相関行 列算出器 204を備え、 さらに時間逆順化部 1 9 1、 波形別合成フィル夕 1 9 2、 、 時間逆順化部 193、 及び歪み計算部 205を備える。
波形別インパルス応答算出部 202は、 固定波形格納部 200からの 3個の 固定波形と合成フィル夕のインパルス応答 h (長さ L=サブフレーム長) を畳 み込んで、 3種類の波形別インパルス応答 (CH l : h l、 CH2 : h 2、 C H3 : h 3, 長さ L=サブフレーム長) を算出する機能を有する。
波形別合成フィル夕 1 92' は、 入力される雑音符号帳探索用夕ーゲット X を時間逆順化した時間逆順化部 1 9 1の出力と波形別インパルス応答算出部 2 02からの波形別インパルス応答 h 1, h 2, h 3それぞれとを畳み込む機能 を有する。
インパルス発生器 203は、 固定波形配置部 20 1で選択された始端候補位 置 Pl、 P2、 P3においてのみ、 それぞれ振幅 1 (極性有り)のパルスを立てて、 チ ャネル別のインパルス (CH 1 : d 1、 CH2 : d 2、 CH3 : d 3) を発生 させる。
相関行列算出部 204は、 波形別インパルス応答算出部 202からの波形別 インパルス応答 h i、 h 2、 h 3それぞれの自己相関と、 111と1 2、 h iと h 3, h 2と h 3の相互相関を計算し、 求めた相関値を相関行列メモリ RRに 展開する。
歪み計算部 205は、 3個の波形別時間逆合成ターゲット (ΧΊ, X'2, X' 3) 、 相関行列メモリ RR、 3個のチャネル別インパルス (d l, d 2, d 3) を用いて、 (数式 4) を変形した (数式 37) によって符号化歪みを最小化す るような雑音符号べクトルを特定する。
Figure imgf000061_0001
d. :チャネル別インパルス (べクトル)
.-±1 0(ん-ひ), =0〜 -1,0 : /番目チャネル n固定波形始端候補位置 H :波形別インパルス応答畳み込み行列 HW
ψ :固定波形畳み込み行列
0 … o o 0 0
Figure imgf000061_0002
W,(2) Wi o o 0 0 o 0 0 0 w, (ム- 1) w
0 w
Figure imgf000061_0003
0 0 0
0 o 0 0 Wi{i -i) …
ただし、 t,.は/番目チャネルの固定波形 (長さ:ム)
Χ\: JCを で時間逆順化合成逆順化したべクトル (^- 7.
ここでは、 (数式 4) から (数式 37) への式変形について、 分母項 (数式 38) 、 分子項 (数式 39) 毎に示しておく。
(x l H c ) 2
= (x ' H {W d x + W 2d 2 + W 3d 3 ))2
= (x 1 ( H ,d , + H 2d 2 + H 3d 3 )) 2
= ((x ' H , )d , + (x ' H 2 )d 2 + (x ' H 3 )d 3 )
= (x I ' d 1 + x 2 l d 2 + Λ; 3 ' ί 3 ) "
= (∑ ; /' 2 (38) χ :雑音符号帳探索ターゲット(べクトル) x': x の転置べクトル
H :合成フィル夕のインパルス応答畳み込み行列
c :雑音符号ベクトル(c = +w2 +« )
wt :固定波形畳み込み行列
dt. :チャネル別インパルス (ベクトル)
H( :波形別インパルス応答畳み込み行列 (H,. =H )
x! : を で時間逆順化合成逆順化したべクトル (χ;' = 'H.)
II2
=\\H(W,d1 + W2d2 + W2d,)\\2
=\\Hxdx + H2d2 + H3d3\\2
= (Η,ά, + H2d2 + H.d.YiH.d, + H2d2 + H3d3)
= (^d1 h 2 + d H + i 3u 3 1d + H d 2 + H 3d3 )
= ' ' (39)
H :合成フィルタのインパルス応答畳み込み行列
c :雑音符号べクトル(c
Figure imgf000062_0001
+w2d2 +w3d3)
wt :固定波形畳み込み行列
dt :チャネル別インパルス (ベクトル)
H,. :波形別インパルス応答畳み込み行列 (H,. -H )
以上のように構成された CE LP型音声符号化装置について、 その動作を説 明する。
まず始めに、 波形別インパルス応答算出部 202がの格納している 3個の固 定波形 Wl、 W2、 W3、 インパルス応答 hを畳み込みんで、 3種類の波形別 インパルス応答 h i、 h 2、 h 3を算出し、 波形別合成フィル夕 1 92' およ び相関行列算出器 204へ出力する。
次に、 波形別合成フィルタ 192' が、 時間逆順化部 191によって時間逆 順化された雑音符号帳探索用夕ーゲット Xと、 入力された 3種類の波形別イン パルス応答 h i、 h2、 h 3それぞれとを畳み込み、 時間逆順化部 193で波 形別合成フィル夕 192' からの 3種類の出力べクトルを再度時間逆順化し、 3個の波形別時間逆合成ターゲット X' 1、 X' 2、 X' 3を それぞれ生成して 歪み計算部 205へ出力する。
次に、 相関行列算出部 204が、 入力された 3種類の波形別インパルス応答 h l、 h 2、 h 3それぞれの自己相関と、 h iと h 2、 h iと h 3、 h 2と h 3の相互相関を計算し、 求めた相関値を相関行列メモリ RRに展開した上で歪 み計算部 205へ出力しておく。
以上の処理を前処理として行った後、 固定波形配置部 201がチャネル毎に 固定波形の始端候補位置を一箇所ずつ選択して、 インパルス発生器 203にそ の位置情報を出力する。
インパルス発生器 203は、固定波形配置部 121より得た選択位置にそれぞ れ振幅 1 (極性有り)のパルスを立ててチャネル別インパルス d 1、 d 2、 d 3 を発生させて歪み計算部 205へ出力する。
そして、 歪み計算部 205が、 3個の波形別時間逆合成夕一ゲット X'l、 X' 2、 X' 3と相関行列メモリ RRと 3個のチャネル別インパルス d 1、 d 2、 d 3 を用いて、 (数式 37) の符号化歪み最小化の基準値を計算する。
固定波形配置部 201が 3個のチャネルそれぞれに対応する始端候補位置を 選択してから歪み計算部 205で歪みを計算するまでの上記処理を、 固定波形 配置部 201が選択しうる始端候補位置の全組合せについて繰り返し行う。 そ して、 (数 37)の符号化歪み探索基準値を最小化する始端候補位置の組合せ番 号と対応するコード番号、 およびその時の最適ゲインを雑音符号べクトルゲイ ン gcを雑音符号帳の符号として特定した後、 伝送部へ伝送する。
なお、 本実施の形態における音声復号化装置は、 実施の形態 1 0の図 1 9 B と同様の構成であり、 音声符号化装置における固定波形格納部及び固定波形配 置部と、 音声複号化装置における固定波形格納部及び固定波形配置部とは同じ 構成を有する。 固定波形格納部が格納する固定波形は、 雑音符号帳探索用夕一 ゲットを用いた (数式 3 ) の符号化歪みの計算式をコスト関数とした学習によ り、 (数式 3 ) のコスト関数を統計的に最小化するような特性を有する固定波 形であるものとする。
このように構成された音声符号化/復号化装置によれば、 固定波形配置部内 の固定波形始端候補位置を代数的に算出できる場合には、 前処理段階で求めた 波形別時間逆合成ターゲットの 3項を加算し、 その結果を 2乗することで (数 式 3 7 ) の分子項を計算できる。 また、 前処理段階で求めた波形別インパルス 応答の相関行列の 9項を加算することで、 (数式 3 7 )の分子項を計算できる。 このため、従来の代数的構造音源(振幅 1のパルス数本で音源べクトルを構成) を雑音符号帳に用いる場合と同程度の演算量で探索ができることになる。
さらに、 合成フィル夕で合成した合成音源ベクトルが、 実際のターゲットと 統計的に近い特性を持つことになり、品質の高い合成音声を得ることができる。 なお、 本実施の形態では、 学習によって得られた固定波形を固定波形格納部 に格納する場合を示したが、 その他、 雑音符号帳探索用ターゲット Xを統計的 に分析し、 その分析結果に基づいて作成した固定波形を用いる場合や、 知見に 基づいて作成した固定波形を用いる場合にも、 同様に品質の高い合成音声を得 ることができる。
また、 本実施の形態では、 固定波形格納部が 3個の固定波形を格納する場合 について説明したが、 固定波形の個数をその他の個数にした場合にも同様の作 用 ·効果が得られる。 また、 本実施の形態では、 固定波形配置部が (表 8 ) に示す固定波形始端候 補位置情報を有する場合について説明したが、 代数的に生成できるものであれ ば、 (表 8 ) 以外の固定波形始端候補位置情報を有する場合についても、 同様 の作用 ·効果が得られる。
(実施の形態 1 3 )
図 2 1は本実施の形態にかかる C E L P型音声符号化装置の構成プロック図 を示す。 本実施の形態の音声符号化装置は、 2種類の雑音符号帳 A 2 1 1、 B 2 1 2と、 2種類の雑音符号帳を切替えるスィッチ 2 1 3と、 雑音符号べクト ルにゲインを乗じる乗算器 2 1 4と、 スィッチ 2 1 3により接続された雑音符 号帳が出力する雑音符号ベクトルを合成する合成フィル夕 2 1 5と、 (数式 2 ) の符号化歪みを計算する歪み計算部 2 1 6とを備えている。
雑音符号帳 A 2 1 1は実施の形態 1 0の音源べクトル生成装置の構成を有し ており、 もう一方の雑音符号帳 B 2 1 2は乱数列から作り出した複数のランダ ムべクトルを格納したランダム数列格納部 2 1 7により構成されている。 雑音 符号帳の切り替えは閉ループで行う。 Xは雑音符号帳探索用ターゲットである。 以上のように構成された C E L P型音声符号化装置について、 その動作を説 明する。
始めにスィッチ 2 1 3は雑音符号帳 A 2 1 1側に接続され、 固定波形配置部 1 8 2が、 (表 8 ) に示す自らが有する固定波形始端候補位置情報に基づいて、 固定波形格納部 1 8 1から読み出した固定波形を始端候補位置から選択した位 置にそれぞれ配置 (シフト) する。 配置された各固定波形は、 加算器 1 8 3で 加算されて雑音符号べクトルとなり、 雑音符号べクトルゲインを乗じられた後 に合成フィル夕 2 1 5に入力される。 合成フィルタ 2 1 5は、 入力された雑音 符号べクトルを合成し、 歪み計算部 2 1 6へ出力する。
歪み計算部 2 1 6は、 雑音符号帳探索用ターゲット Xと合成フィルタ 2 1 5 から得た合成ベクトルとを用いて、 (数式 2 ) の符号化歪みの最小化処理を行 う。
歪み計算部 2 1 6は、 歪みを計算した後、 固定波形配置部 1 8 2へ信号を送 り、 固定波形配置部 1 8 2が始端候補位置を選択してから歪み計算部 2 1 6で 歪みを計算するまでの上記処理を、 固定波形配置部 1 8 2が選択しうる始端候 補位置の全組合せについて繰り返し行う。
その後、 符号化歪みが最小化される始端候補位置の組合せを選択し、 その始 端候補位置の組合せと一対一に対応する雑音符号べクトルのコード番号、 その 時の雑音符号べクトルゲイン gc、 及び符号化歪み最小値を記憶しておく。 次に、 スィッチ 2 1 3は雑音符号帳 B 2 1 2側に接続され、 ランダム数列格 納部 2 1 7から読み出されたランダム数列が雑音符号ベクトルとなり、 雑音符 号ベクトルゲインを乗じられた後、 合成フィルタ 2 1 5に入力される。 合成フ ィル夕 2 1 5は、 入力された雑音符号ベクトルを合成し、 歪み計算部 2 1 6へ 出力する。
歪み計算部 2 1 6は、 雑音符号帳探索用ターゲット Xと合成フィル夕 2 1 5 から得た合成ベクトルとを用いて、 (数式 2 ) の符号化歪みを計算する。 歪み計算部 2 1 6は、 歪みを計算した後、 ランダム数列格納部 2 1 7へ信号 を送り、 ランダム数列格納部 2 1 7力 S雑音符号べクトルを選択してから歪み計 算部 2 1 6で歪みを計算するまでの上記処理を、 ランダム数列格納部 2 1 7が 選択しうる全ての雑音符号べクトルについて繰り返し行う。
その後、 符号化歪みが最小化される雑音符号ベクトルを選択し、 その雑音符 号ベクトルのコード番号、 その時の雑音符号ベクトルゲイン gc、 及び符号化歪 み最小値を記憶しておく。
次に、 歪み計算部 2 1 6は、 スィッチ 2 1 3を雑音符号帳 A 2 1 1に接続し た時に得られた符号化歪み最小値と、 スィッチ 2 1 3を雑音符号帳 B 2 1 2に P T JP97
65 接続した時に得られた符号化歪み最小値とを比較し、 小さい方の符号化歪みが 得られた時のスィッチの接続情報、 及びその時のコード番号と雑音符号べクト ルゲインを音声符号として決定し、 図示していない伝送部へ伝送する。
なお、 本実施の形態にかかる音声符号化装置と対になる音声復号化装置は、 雑音符号帳 A、 雑音符号帳 B、 スィッチ、 雑音符号ベクトルゲイン、 及び合成 フィル夕を、 図 2 1と同様の構成で配置したものを有してなるもので、 伝送部 より入力される音声符号に基づいて、 使用される雑音符号帳と雑音符号べクト ル及び雑音符号べクトルゲインが決定され、 合成フィル夕の出力として合成音 源べクトルが得られる。
このように構成された音声符号化装置ノ復号化装置によれば、 雑音符号帳 A によって生成される雑音符号べクトルと雑音符号帳 Bによって生成される雑音 符号ベクトルの中から、 (数式 2 ) の符号化歪みを最小化するものを閉ループ 選択できるため、 より実音声に近い音源べクトルを生成することが可能となる とともに、 品質の高い合成音声を得ることができる。
なお、 本実施の形態では、 従来の C E L P型音声符号化装置である図 2の構 成を基にした音声符号化 復号化装置を示したが、 図 1 9 A, Bもしくは図 2 0の構成を基にした C E L P型音声符号化装置ノ複号化装置に本実施の形態を 適用しても、 同様の作用 ·効果を得ることができる。
なお、 本実施の形態では、 雑音符号帳 A 2 1 1は図 1 8の構造を有するとし たが、 固定波形格納部 1 8 1がその他の構造を有する場合 (例えば、 固定波形 を 4本有する場合など) についても同様の作用 ·効果が得られる。
なお、本実施の形態では、雑音符号帳 A 2 1 1の固定波形配置部 1 8 2が(表 8 ) に示す固定波形始端候補位置情報を有する場合について説明したが、 その 他の固定波形始端候補位置情報を有する場合についても同様の作用 ·効果が得 られる。 また、 本実施の形態では、 雑音符号帳 B 2 1 2が複数のランダム数列を直接 メモリに格納するランダム数列格納部 2 1 7によって構成された場合について 説明したが、 雑音符号帳 B 2 1 2がその他の音源構成を有する場合 (例えば、 代数的構造音源生成情報により構成される場合) についても同様の作用 '効果 が得られる。
なお、 本実施の形態では、 2種類の雑音符号帳を有する C E L P型音声符号 化 Z復号化装置について説明したが、 雑音符号帳が 3種類以上ある C E L P型 音声符号化 Z複号化装置を用いた場合にも同様の作用 '効果を得ることができ る。
(実施の形態 1 4 )
図 2 2は本実施の形態における C E L P型音声符号化装置の構成プロック図 を示す。 本実施の形態における音声符号化装置は、 雑音符号帳を 2種類有し、 一方の雑音符号帳は実施の形態 1 0の図 1 8に示す音源べクトル生成装置の構 成であり、 もう一方の雑音符号帳は複数のパルス列格納したパルス列格納部に より構成され、 雑音符号帳探索以前に既に得られている量子化ピッチゲインを 利用し、 雑音符号帳を適応的に切り替えて用いる。
雑音符号帳 A 2 1 1は、 固定波形格納部 1 8 1、 固定波形配置部 1 8 2、 加 算部 1 8 3により構成され、 図 1 8の音源べクトル生成装置に対応する。 雑音 符号帳 B 2 2 1は、 複数のパルス列を格納したパルス列格納部 2 2 2により構 成されている。雑音符号帳 A 2 1 1と雑音符号帳 B 2 2 1とをスィッチ 2 1 3 ' が切り替える。 また、 乗算器 2 2 4は適応符号帳 2 2 3の出力に雑音符号帳探 索時には既に得られているピッチゲインを乗じた適応符号べクトルを出力する。 ピッチゲイン量子化器 2 2 5の出力はスィッチ 2 1 3, へ与えられる。
以上のように構成された C E L P型音声符号化装置について、 その動作を説 明する。 従来の C E L P型音声符号化装置では、 まず適応符号帳 2 2 3の探索が行わ れ、次にその結果を受けて雑音符号帳探索が行われる。 この適応符号帳探索は、 適応符号帳 2 2 3に格納されている複数の適応符号べクトル (適応符号べクト ルと雑音符号べクトルを、 それぞれのゲインを乗じた後に加算して得られたベ クトル) から最適な適応符号ベクトルを選択する処理であり、 結果として、 適 応符号べクトルのコ一ド番号およびピッチゲインが生成される。
本実施の形態の C E L P型音声符号化装置では、 このピッチゲインをピッチ ゲイン量子化部 2 2 5において量子化し、 量子化ピッチゲインを生成した後に 雑音符号帳探索が行われる。 ピッチゲイン量子化部 2 2 5で得られた量子化ピ ツチゲインは、 雑音符号帳切り替え用のスィッチ 2 1 3 ' へ送られる。
スィッチ 2 1 3 ' は、 量子化ピッチゲインの値が小さい時は、 入力音声は無 声性が強いと判断して雑音符号帳 A 2 1 1を接続し、 量子化ピッチゲインの値 が大きい時は、 入力音声は有声性が強いと判断して雑音符号帳 B 2 2 1を接続 する。
スィッチ 2 1 3 ' が雑音符号帳 A 2 1 1側に接続された時、 固定波形配置部 1 8 2が、 (表 8 ) に示す自らが有する固定波形始端候補位置情報に基づいて、 固定波形格納部 1 8 1から読み出した固定波形を始端候補位置から選択した位 置にそれぞれ配置 (シフト) する。 配置された各固定波形は、 加算器 1 8 3に 出力され、 加算されて雑音符号ベクトルとなり、 雑音符号ベクトルゲインを乗 じられてから合成フィル夕 2 1 5に入力される。 合成フィル夕 2 1 5は、 入力 された雑音符号べクトルを合成し、 歪み計算部 2 1 6へ出力する。
歪み計算部 2 1 6は、 雑音符号帳探索用タ一ゲット Xと合成フィルタ 2 1 5 から得た合成ベクトルとを用いて、 (数式 2 ) の符号化歪みを計算する。
歪み計算部 2 1 6は、 歪みを計算した後、 固定波形配置部 1 8 2へ信号を送 り、 固定波形配置部 1 8 2が始端候補位置を選択してから歪み計算部 2 1 6で 歪みを計算するまでの上記処理を、 固定波形配置部 1 8 2が選択しうる始端候 補位置の全組合せについて繰り返し行う。
その後、 符号化歪みが最小化される始端候補位置の組合せを選択し、 その始 端候補位置の組合せと一対一に対応する雑音符号べクトルのコード番号、 その 時の雑音符号ベクトルゲイン gc、 及び量子化ピッチゲインを、 音声符号として 伝送部へ伝送する。 本実施の形態では、 音声符号化を行う前に、 固定波形格納 部 1 8 1に格納する固定波形パターンに対して事前に無声音の性質を反映させ ておく。
一方、 スィッチ 2 1 3 ' が雑音符号帳 B 2 2 1側に接続された時には、 ノ \°ル ス列格納部 2 2 2から読み出されたパルス列が雑音符号べクトルとなり、 スィ ツチ 2 1 3 ' 、 雑音符号ベクトルゲインの乗算工程を経て、 合成フィル夕 2 1 5に入力される。 合成フィル夕 2 1 5は、 入力された雑音符号ベクトルを合成 し、 歪み計算部 2 1 6へ出力する。
歪み計算部 2 1 6は、 雑音符号帳探索用夕一ゲット Xと合成フィル夕 2 1 5 から得た合成ベクトルとを用いて、 (数式 2 ) の符号化歪みを計算する。 歪み計算部 2 1 6は、 歪みを計算した後、 パルス列格納部 2 2 2へ信号を送 り、 パルス列格納部 2 2 2が雑音符号べクトルを選択してから歪み計算部 2 1 6で歪みを計算するまでの上記処理を、 パルス列格納部 2 2 2が選択しうる全 ての雑音符号べクトルについて繰り返し行う。
その後、 符号化歪みが最小化される雑音符号ベクトルを選択し、 その雑音符 号ベクトルのコード番号、 その時の雑音符号ベクトルゲイン gc、 及び量子化ピ ツチゲインを、 音声符号として伝送部へ伝送する。
なお、 本実施の形態の音声符号化装置と対になる音声復号化装置は、 雑音符 号帳 A、 雑音符号帳 B、 スィッチ、 雑音符号ベクトルゲイン、 及び合成フィル 夕を、 図 2 2と同様の構成で配置したものを有してなるもので、 まず伝送され てきた量子化ピッチゲインを受け、 その大小によって、 符号化装置側ではスィ ツチ 2 1 3 ' が雑音符号帳 A 2 1 1側に接続されていたの力 雑音符号帳 B 2 2 1側に接続されていたのかを判断する。 次に、 コード番号及び雑音符号べク トルゲインの符号に基づいて、 合成フィル夕の出力として合成音源べクトルが 得られる。
このように構成された音源符号化/復号化装置によれば、入力音声の特徴 (本 実施の形態では、 量子化ピッチゲインの大きさを有声性ノ無声性の判断材料と して利用している) に応じて、 2種類の雑音符号帳を適応的に切り替えること ができ、 入力音声の有声性が強い場合にはパルス列を雑音符号べクトルとして 選択し、 無声性が強い場合には無声音の性質を反映した雑音符号べクトルを選 択することが可能になり、 より実音性に近い音源べクトルを生成することが可 能となるとともに、 合成音の品質向上を実現することができる。 本実施の形態 では、 上記のようにスィッチの切り替えを開ループで行うため、 伝送する情報 量を増加させることによって当該作用 ·効果を向上させることができる。 なお、 本実施の形態では、 従来の C E L P型音声符号化装置である図 2の構 成を基にした音声符号化ノ複号化装置を示したが、 図 1 9 A, Bもしくは図 2 0の構成を基にした C E L P型音声符号化ノ復号化装置に本実施の形態を適用 しても、 同様の効果を得ることができる。
また、 本実施の形態では、 スィッチ 2 1 3 ' を切り替えるためのパラメータ として、 ピッチゲイン量子化器 2 2 5で適応符号べクトルのピッチゲインを量 子化して得た量子化ピッチゲインを用いたが、 代わりにピッチ周期算出器を備 え、 適応符号べクトルから算出したピッチ周期を用いても良い。
なお、 本実施の形態では、 雑音符号帳 A 2 1 1は図 1 8の構造を有するとし たが、 固定波形格納部 1 8 1がその他の構造を有する場合 (例えば、 固定波形 を 4本有する場合など) についても同様の作用 '効果が得られる。 なお、本実施の形態では、雑音符号帳 A 2 1 1の固定波形配置部 1 8 2が(表 8 ) に示す固定波形始端候補位置情報を有する場合について説明したが、 その 他の固定波形始端候補位置情報を有する場合についても同様の作用 ·効果が得 られる。
また、 本実施の形態では、 雑音符号帳 B 2 2 1がパルス列を直接メモリに格 納するパルス列格納部 2 2 2によって構成された場合について説明したが、 雑 音符号帳 B 2 2 1がその他の音源構成を有する場合 (例えば、 代数的構造音源 生成情報により構成される場合) についても同様の作用 ·効果が得られる。 なお、 本実施の形態では、 2種類の雑音符号帳を有する C E L P型音声符号 化 Z複号化装置について説明したが、 雑音符号帳が 3種類以上ある C E L P型 音声符号化 Z複号化装置を用いた場合にも同様の作用 ·効果を得ることができ る。
(実施の形態 1 5 )
図 2 3は本実施の形態にかかる C E L P型音声符号化装置の構成プロックを 示す。 本実施の形態における音声符号化装置は、 雑音符号帳を 2種類有し、 一 方の雑音符号帳は実施の形態 1 0の図 1 8に示す音源べクトル生成装置の構成 で 3個の固定波形を固定波形格納部に格納したものであり、 もう一方の雑音符 号帳は同様に図 1 8に示す音源べクトル生成装置の構成であるが、 固定波形格 納部に格納した固定波形は 2個のものであり、 上記 2種類の雑音符号帳の切り 替えを閉ループで行う。
雑音符号帳 A 2 1 1は、 3個の固定波形を格納した固定波形格納部 A 1 8 1、 固定波形配置部 A 1 8 2、 加算部 1 8 3により構成され、 図 1 8の音源べクト ル生成装置の構成で 3個の固定波形を固定波形格納部に格納したものに対応す る。
雑音符号帳 B 2 3 0は、 2個の固定波形を格納した固定波形格納部 B 2 3 1、 (表 9 ) に示す固定波形始端候補位置情報を備えた固定波形配置部 B 2 3 2、 固定波形配置部 B 2 3 2により配置された 2本の固定波形を加算して雑音符号 べクトルを生成する加算部 2 3 3により構成され、 図 1 8の音源べクトル生成 装置の構成で 2個の固定波形を固定波形格納部に格納したものに対応する。
表 9
Figure imgf000073_0001
その他の構成は上述した実施の形態 1 3と同じである。
以上のように構成された C E L P型音声符号化装置について、 その動作を説 明する。
始めにスィッチ 2 1 3は雑音符号帳 A 2 1 1側に接続され、 固定波形格納部 A 1 8 1が、 (表 8 ) に示す自らが有する固定波形始端候補位置情報に基づい て、 固定波形格納部 A 1 8 1から読み出した 3つの固定波形を始端候補位置か ら選択した位置にそれぞれ配置(シフト)する。配置された 3つの固定波形は、 加算器 1 8 3に出力され、 加算されて雑音符号ベクトルとなり、 スィッチ 2 1 3、 雑音符号ベクトルのゲインを乗じる乗算器 2 1 3を経て、 合成フィル夕 2 1 5に入力される。 合成フィル夕 2 1 5は、 入力された雑音符号ベクトルを合 成し、 歪み計算部 2 1 6へ出力する。
歪み計算部 2 1 6は、 雑音符号帳探索用夕一ゲット Xと合成フィルタ 2 1 5 から得た合成ベクトルを用いて、 (数式 2 ) の符号化歪みを計算する。 歪み計算部 2 1 6は、 歪みを計算した後、 固定波形配置部 A 1 8 2へ信号を 送り、 固定波形配置部 A 1 8 2が始端候補位置を選択してから歪み計算部 2 1 6で歪みを計算するまでの上記処理を、 固定波形配置部 A 1 8 2が選択しうる 始端候補位置の全組合せについて繰り返し行う。
その後、 符号化歪みが最小化される始端候補位置の組合せを選択し、 その始 端候補位置の組合せと一対一に対応する雑音符号べクトルのコード番号、 その 時の雑音符号べクトルゲイン gc、 及び符号化歪み最小値を記憶しておく。
本実施の形態では、 音声符号化を行う前に、 固定波形格納部 A 1 8 1に格納 する固定波形パターンは、 固定波形が 3個という条件のもとで最も歪みが小さ くなるように学習して得られたものを用いる。
次にスィッチ 2 1 3は雑音符号帳 B 2 3 0側に接続され、 固定波形格納部 B 2 3 1が、 (表 9 ) に示す自らが有する固定波形始端候補位置情報に基づいて、 固定波形格納部 B 2 3 1から読み出した 2つの固定波形を始端候補位置から選 択した位置にそれぞれ配置 (シフト) する。 配置された 2つの固定波形は、 カロ 算器 2 3 3に出力され、加算されて雑音符号べクトルとなり、スィッチ 2 1 3、 雑音符号べクトルゲインを乗算する乗算器 2 1 4を経て、 合成フィル夕 2 1 5 に入力される。合成フィル夕 2 1 5は、入力された雑音符号べクトルを合成し、 歪み計算部 2 1 6へ出力する。
歪み計算部 2 1 6は、 雑音符号帳探索用夕ーゲット Xと合成フィル夕 2 1 5 から得た合成ベクトルを用いて、 (数式 2 ) の符号化歪みを計算する。
歪み計算部 2 1 6は、 歪みを計算した後、 固定波形配置部 B 2 3 2へ信号を 送り、 固定波形配置部 B 2 3 2が始端候補位置を選択してから歪み計算部 2 1 6で歪みを計算するまでの上記処理を、 固定波形配置部 B 2 3 2が選択しうる 始端候補位置の全組合せについて繰り返し行う。
その後、 符号化歪みが最小化される始端候補位置の組合せを選択し、 その始 端候補位置の組合せと一対一に対応する雑音符号べクトルのコード番号、 その 時の雑音符号ベクトルゲイン gc、 及び符号化歪み最小値を記憶しておく。 本実 施の形態では、 音声符号化を行う前に、 固定波形格納部 B 2 3 1に格納する固 定波形パターンは、 固定波形が 2個という条件のもとで最も歪みが小さくなる ように学習して得られたものを用いる。
次に、 み計算部 2 1 6は、 スィッチ 2 1 3を雑音符号帳 A 2 1 1に接続した 時に得られた符号化歪み最小値と、 スィッチ 2 1 3を雑音符号帳 B 2 3 0に接 続した時に得られた符号化歪み最小値を比較し、 小さい方の符号化歪みが得ら れた時のスィッチの接続情報、 及びその時のコード番号と雑音符号べクトルゲ インを音声符号として決定し、 伝送部へ伝送する。
なお、 本実施の形態における音声復号化装置は、 雑音符号帳 A、 雑音符号帳 B、 スィッチ、 雑音符号ベクトルゲイン、 及び合成フィルタを、 図 2 3と同様 の構成で配置したものを有してなるもので、 伝送部より入力される音声符号に 基づいて、 使用される雑音符号帳と雑音符号べクトル及び雑音符号べクトルゲ インが決定され、 合成フィル夕の出力として合成音源べクトルが得られる。 このように構成された音声符号化 復号化装置によれば、 雑音符号帳 Aによ つて生成される雑音符号べクトルと雑音符号帳 Bによって生成される雑音符号 ベクトルの中から、 (数式 2 ) の符号化歪みを最小化するものを閉ループ選択 できるため、 より実音声に近い音源べクトルを生成することが可能となるとと もに、 品質の高い合成音声を得ることができる。
なお、 本実施の形態では、 従来の C E L P型音声符号化装置である図 2の構 成を基にした音声符号化 Z復号化装置を示したが、 図 1 9 A, Bもしくは図 2 0の構成を基にした C E L P型音声符号化 復号化装置に本実施の形態を適用 しても、 同様の効果を得ることができる。
なお、 本実施の形態では、 雑音符号帳 A 2 1 1の固定波形格納部 A 1 8 1が 3個の固定波形を格納する場合について説明したが、 固定波形格納部 A 1 8 1 がその他の個数の固定波形を有する場合 (例えば、 固定波形を 4個有する場合 など) についても同様の作用 ·効果が得られる。 雑音符号帳 B 2 3 0について も同様である。
また、 本実施の形態では、 雑音符号帳 A 2 1 1の固定波形配置部 A 1 8 2が (表 8 ) に示す固定波形始端候補位置情報を有する場合について説明したが、 その他の固定波形始端候補位置情報を有する場合についても同様の作用 ·効果 が得られる。 雑音符号帳 B 2 3 0についても同様である。
なお、 本実施の形態では、 2種類の雑音符号帳を有する C E L P型音声符号 化 Z復号化装置について説明したが、 雑音符号帳が 3種類以上ある C E L P型 音声符号化 復号化装置を用いた場合にも同様の作用 ·効果を得ることができ る。
(実施の形態 1 6 )
図 2 4に本実施の形態にかかる C E L P型音声符号化装置の機能プロック図 を示している。 この音声符号化装置は、 L P C分析部 2 4 2において、 入力さ れた音声デ一夕 2 4 1に対して自己相関分析と L P C分析を行なうことによつ て L P C係数を得、また得られた L P C係数の符号化を行ない L P C符号を得、 また得られた L P C符号を符号化して復号化 L P C係数を得る。
次に、 音源作成部 2 4 5において、 適応符号帳 2 4 3と音源べクトル生成装 置 2 4 4から適応コードべクトルと雑音コードべクトルを取り出し、 それぞれ を L P C合成部 2 4 6へ送る。 音源べクトル生成装置 2 4 4には上述した実施 の形態 1〜4, 1 0のいずれかの音源ベクトル生成装置を用いるものとする。 更に、 L P C合成部 2 4 6において、 音源作成部 2 4 5で得られた 2つの音源 に対して、 L P C分析部 2 4 2で得られた復号化 L P C係数によってフィルタ リングを行ない 2つの合成音を得る。 更に、 比較部 2 4 7においては、 L P C合成部 2 4 6で得られた 2つの合成 音と入力音声との関係を分析し 2つの合成音の最適値 (最適ゲイン) を求め、 その最適ゲインによってパワー調整したそれぞれの合成音を加算して総合合成 音を得、 その総合合成音と入力音声の距離計算を行なう。
また、 適応符号帳 2 4 3と音源べクトル生成装置 2 4 4の発生させる全ての 音源サンプルに対して音源作成部 2 4 5、 L P C合成部 2 4 6を機能させるこ とによって得られる多くの合成音と入力音声との距離計算を行ない、 その結果 得られる距離の中でも最も小さいときの音源サンプルのインデクスを求める。 得られた最適ゲインと、 音源サンプルのインデクス、 さらにそのインデクスに 対応する 2つの音源をパラメータ符号化部 2 4 8へ送る。
パラメ一夕符号化部 2 4 8では、 最適ゲインの符号化を行なうことによって ゲイン符号を得、 L P C符号、 音源サンプルのインデクスをまとめて伝送路 2 4 9へ送る。 また、 ゲイン符号とインデクスに対応する 2つの音源から実際の 音源信号を作成し、 それを適応符号帳 2 4 3に格納すると同時に古い音源サン プルを破棄する。
図 2 5にパラメ一夕符号化部 2 4 8におけるゲインのべクトル量子化に関す る部分の機能プロックが示されている。
パラメ一夕符号化部 2 4 8は、 入力される最適ゲイン 2 5 0 1の要素の和と その和に対する比率に変換して量子化対象べクトルを求めるパラメ一夕変換部 2 5 0 2と、 復号化べクトル格納部に格納された過去の復号化されたコードべ クトルと予測係数格納部に格納された予測係数を用いて夕ーゲットべクトルを 求めるターゲット抽出部 2 5 0 3と、 過去の復号化されたコードべクトルが格 納されている復号化べクトル格納部 2 5 0 4と、 予測係数が格納されている予 測係数格納部 2 5 0 5と、 予測係数格納部に格納された予測係数を用いてべク トル符号帳に格納されている複数のコードべクトルと夕一ゲット抽出部で得ら れた夕一ゲットべクトルとの距離を計算する距離計算部 2 5 0 6と、 複数のコ —ドべクトルが格納されているべクトル符号帳 2 5 0 7と、 べクトル符号帳と 距離計算部を制御して距離計算部から得られた距離の比較によって最も適当と するコードべクトルの番号を求め、 求めた番号からべクトル格納部に格納され たコードべクトルを取り出し同べクトルを用いて復号化べクトル格納部の内容 を更新する比較部 2 5 0 8とを備えている。
以上のように構成されたパラメ一夕符号化部 24 8の動作について詳細に説 明する。 予め、 量子化対象ベクトルの代表的サンプル (コードベクトル) が複 数格納されたベクトル符号帳 2 5 0 7を作成しておく。 これは、 一般には、 多 くの音声データを分析して得られた多数のべクトルを基に、 L B Gァルゴリズ ム (I EEE TRANSACT I ONS ON CO MUN I CAT I O NS, VOL. COM- 2 8, NO. 1 , P P 84— 9 5, J ANUARY 1 9 8 0) によって作成する。
また、 予測係数格納部 2 5 0 5には予測符号化を行なうための係数を格納し ておく。 この予測係数についてはアルゴリズムの説明の後で説明する。 また、 復号化べクトル格納部 2 5 0 4には初期値として無音状態を示す値を格納して おく。 例として、 最もパワーの小さいコードベクトルが挙げられる。
まず、 入力された最適ゲイン 2 5 0 1 (適応音源のゲインと雑音音源のゲイ ン) をパラメ一夕変換部 2 5 0 2において和と割合の要素のベクトル (入力) に変換する。 変換方法を、 (数式 4 0) に示す。
P = log(Ga + Gs)
(4 0)
R = Ga/(Ga + Gs)
(Ga,Gs) :最適ゲイン
Ga :適応音源のゲイン
Gs :確率的音源のゲイン (P,R) :入力べクトル
P:和
R :割合
ただし、 上記において G aは必ずしも正の値ではない。 したがって、 Rが負 の値になる場合もある。 また、 G a + G sが負になった場合には予め用意した 固定値を代入しておく。
次に、 ターゲット抽出部 2 5 0 3において、 パラメ一夕変換部 2 5 0 2で得 られたべクトルを基に、 複号化べクトル格納部 2 5 0 4に格納された過去の復 号化べクトルと予測係数格納部 2 5 0 5に格納された予測係数を用いて夕ーゲ ットベクトル得る。 ターゲットベクトルの算出式を (数式 4 1 ) に示す。
Tp = P-( Upi x pi + ^ Vpi x ri)
Tr = R - (^ Uri x pi + Vri x ri)
( 4 1 )
(Tp, Tr) :夕一ゲットべクトル
(P,R) :入力べクトル
(pi,ri) :過去の復号化べクトル
Upi, Vpi, Uri, Vri :予測係数(固定値)
:いくつ前の復号化ベクトルかを示すインデクス
I :予測次数
次に距離計算部 2 5 0 6においては、 予測係数格納部 2 5 0 5に格納された 予測係数を用いて、 夕一ゲット抽出部 2 5 0 3で得られた夕一ゲットべクトル とべクトル符号帳 2 5 0 7に格納されたコードべクトルとの距離を計算する。 距離の計算式を (数式 4 2 ) に示す。 Dn = Wpx(Tp- UpO x Cpn - VpO x Crnf
+ Wrx (Tr - UpO x Cpn-VrO x Crnf (4 2) Dn :夕一ゲットべクトルとコードべクトルとの距離
(Tp,Tr) :ターゲットべクトル
UpO,VpO,UrO,VrO :予測係数(固定値)
(Cpn,Crn):コードベクトル
n :コードべクトルの番号
Wp,Wr :歪に対する感度を調節する重み係数(固定)
次に、 比較部 2 5 0 8は、 べクトル符号帳 2 5 0 7と距離計算部 2 5 0 6を 制御し、 べクトル符号帳 2 5 0 7に格納された複数のコードべクトルの中で距 離計算部 2 5 0 6にて算出された距離の最も小さくなるコードべクトルの番号 を求め、 これをゲインの符号 2 5 0 9とする。 また、 得られたゲインの符号 2 5 0 9を基に複号化べクトルを求め、 これを用いて復号化べクトル格納部 2 5 04の内容を更新する。 復号化ベクトルの求め方を (数式 4 3) に示す。
I I
p = ( Upi x pi + > Vpi x ri) + UpO x Cpn + VpO x Cm
R = Uri xpi + ^ Vri x ri) + UrO x Cpn + VrO x Cm (43)
(Cpn,Crn) :コードベクトル
(p,r) :複号化べクトル
(pi,ri):過去の復号化べクトル
Upi,Vpi,Uri,Vri :予測係数(固定値)
:いくつ前の復号化ベクトルかを示すインデクス
I :予測次数
n :コードべクトルの番号 また、 更新の方法を (数式 44) に示す。
処理の順番
pO = CpN rO = CrN
pi = pi-1 (i = 1 〜 1)
ri =ri-\ (!· = 1 〜 1) (44)
N :ゲインの符号
一方、 復号化装置 (デコーダ) では、 予め符号化装置と同様のベクトル符号 帳、 予測係数格納部、 複号化ベクトル格納部を用意しておき、 符号化装置から 伝送されてきたゲインの符号に基づいて、 符号化装置の比較部の復号化べクト ル作成と復号化べクトル格納部の更新の機能によつて複号化を行なう。
ここで、 予測係数格納部 2505に格納する予測係数の設定方法について説 明する。
予測係数は、 まず多くの学習用音声データについて量子化を行ない、 その最 適ゲインから求めた入力べクトルと量子化時の複号化べクトルを収集して母集 団を作成し、 そしてその母集団について以下の (数式 45) に示す総合歪を最 小化することにより求める。 具体的には、 各 Up i、 Ur iで総合歪の式を偏 微分して得られる連立方程式を解くことによって Up i、Ur iの値を求める。
T I
Total = \ Wp X (Pt Upi x pt,i)2 +
Wr x (Rt - ^ Uri x rt,i) 2 \ pt,0 = Cpn{t)
rt,0 = Crnt)
(45) Total :総合歪
t :時間(フレーム番号)
T:母集団のデータ数
(Pt,Rt):時間 tにおける最適ゲイン
(pti,rt,i) :時間 tにおける復号化べクトル
Upi,Vpi,Uri,Vri :予測係数(固定値)
i :いくつ前の復号化ベクトルかを示すインデクス
I :予測次数
(Cpn(l) ,Crn(l)):時間 tにおけるコードベクトル
Wp,Wr :歪に対する感度を調節する重み係数(固定) このようなべクトル量子化法によれば、 最適ゲインをそのままべクトル量子 化でき、 パラメータ変換部の特徴によりパワーと各ゲインの相対的大きさの相 関を利用することが出来るようになり、 復号化ベクトル格納部、 予測係数格納 部、 ターゲット抽出部、 距離計算部の特徴によりパワーと 2つのゲインの相対 的関係の間の相関を利用したゲインの予測符号化が実現でき、 これらの特徴に よりパラメ一夕同志の相関を十分に利用することが可能となる。
(実施の形態 1 7 )
図 2 6に本実施の形態にかかる音声符号化装置のパラメ一夕符号化部の機能 ブロック図を示す。 本実施の形態では、 音源のインデクスに対応する 2つの合 成音と聴感重み付き入力音声からゲインの量子化による歪を評価しながらべク トル量子化を行う。
図 2 6に示すように、 このパラメ一夕符号化部は、 入力される聴感重み付け 入力音声と聴感重み付け L P C合成済み適応音源と聴感重み付け L P C合成済 み雑音音源 2 6 0 1である入力データと復号化べクトル格納部に格納された復 号化べクトルと予測係数格納部に格納された予測係数から距離計算に必要なパ ラメ一夕を計算するパラメータ計算部 2602と、 過去の復号化されたコード べクトルが格納されている復号化べクトル格納部 2603と、 予測係数が格納 されている予測係数格納部 2604と、 予測係数格納部に格納された予測係数 を用いてべクトル符号帳に格納されている複数のコードべクトルで復号した時 の符号化歪を計算する距離計算部 2605と、 複数のコードべクトルが格納さ れているべクトル符号帳 2606と、 べクトル符号帳と距離計算部を制御して 距離計算部から得られた符号化歪の比較によって最も適当とするコードべク卜 ルの番号を求め、 求めた番号からべクトル格納部に格納されたコードべクトル を取り出し同べクトルを用いて復号化べクトル格納部の内容を更新する比較部 2607とを備えている。
以上のように構成されたパラメ一夕符号化部のべクトル量子化動作について 説明する。 予め、 量子化対象ベクトルの代表的サンプル (コードベクトル) が 複数格納されたべクトル符号帳 2606を作成しておく。 一般には LBGアル ゴリズム (I EEE TRANSACT I ONS ON COMMUN I CA T I ONS, VOL. COM— 28, NO. 1, PP 84— 95, J ANUA RY 1980) 等によって作成する。 また、 予測係数格納部 2604には予 測符号化を行なうための係数を格納しておく。 この係数は (実施の形態 16) で説明した予測係数格納部 2505に格納する予測係数と同じものを用いる。 また、 復号化べクトル格納部 2603には初期値として無音状態を示す値を格 納しておく。
まず、 パラメ一夕計算部 2602において、 入力された、 聴感重み付け入力 音声、 聴感重み付け LP C合成済み適応音源、 聴感重み付け LP C合成済み雑 音音源 2601、 更に、 復号化べクトル格納部 2603に格納された復号化べ クトル、 予測係数格納部 2604に格納された予測係数から距離計算に必要な パラメ一夕を計算する。 距離計算部における距離は、 次の (数式 46) に基づ <
En (Xi - Gan x Ai - Gsn x Si)
i-0
Gan = O rn x e x p(Opn)
Gsn = (1 - O rn) x e x p(Opn)
Opn = Yp + UpO x Cpn + VpO x Crn
Yp = J Upj x pj + ^ Vpj x rj Yr = ^ Urj x pj + ^ Vrj x rj
(46)
Gan,Gsn :復号化ゲイン
(Opn,Orn) :復号化べクトル
(Yp,Yr) :予測べクトル
En : "番のゲインコードベクトルを用いた時の符号化歪
Xi :聴感重み付け入力音声
Ai :聴感重み付け LPC合成済み適応音源
Si :聴感重み付け LPC合成済み確率的音源
n :コードべクトルの符号
:音源データのインデクス
/ :サブフレーム長 (入力音声の符号化単位)
(Cpn,Crn):コードベクトル
(pj,rj) 過去の復号化べクトル
Upj,Vpj,Urj,Vrj :予測係数(固定値)
; :いくつ前の複号化べクトルかを示すインデクス
J :予測次数
したがって、 パラメ一夕計算部 26 0 2ではコードべクトルの番号に依存し ない部分の計算を行なう。 計算しておくものは、 上記予測ベクトルと 3つの合 成音間の相関、 パワーである。 計算式を (数式 4 7) に示す。
Figure imgf000085_0001
j J
Yr = Y U rj x pj + J リ' x rj
I - 1 1 ) Λ:Λ; = Ϋ Xi x Xi D xa = ^ X i x A i x 2 D xs = ^ X i x Si x 2 D a a = ^ A i x A i D as = ^ A i x Si x 2
I
D ss = 2 Si x Si
(4 7 )
(Yp,Yr) :予測べクトル
Dxx, Dxa , Dxs, Daa , Das, Dss :合成音間の相関値、 パワー
Xi :聴感重み付け入力音声
Ai :聴感重み付け LPC合成済み適応音源
Si :聴感重み付け LPC合成済み確率的音源
i :音源データのインデクス
I :サブフレーム長 (入力音声の符号化単位)
(pj,rj) :過去の複号化べクトル
Upj,Vpj,Urj,Vrj :予測係数(固定値)
j :いくつ前の復号化ベクトルかを示すインデクス
J :予測次数 次に、 距離計算部 2 6 0 5において、 パラメ一夕計算部 2 6 0 2で計算した 各パラメ一夕、 予測係数格納部 2 6 0 4に格納された予測係数、 ベクトル符号 帳 2 6 0 6に格納されたコードベクトルから、 符号化歪を算出する。 算出式を 次の (数式 4 8 ) に示す。
En = Dxx + (Gan)2 x Daa + (Gsn)2 x Dss 一 Gan x Dxa一 sn x Dxs + Gan x Gsn x Das
Gan = Orn x cxp(Opn )
Gsn = (1 - Orn ) x &xp(Opn )
Opn = Yp + UpO x Cpn + VpO x Cm
Orn = Yr + UrO x Cpn + VrO x Cm
( 4 8 )
En : w番のゲインコードべクトルを用いた時の符号化歪
Dxx, Dxa , Dxs, Daa , Das, Dss :合成音間の相関値、 パワー
Gan,Gsn :復号化ゲイン
(Ορη,Ονη) :復号化べクトル
(Yp,Yr) :予測べクト
UpO,VpO,UrO,VrO:予測係数(固定値)
(Cpn, Crn):コードベクトル
n :コードべクトルの番号
なお、 実際には D x xはコードベクトルの番号 nに依存しないので、 その加 算を省略することができる。
次に、 比較部 2 6 0 7は、 ベクトル符号帳 2 6 0 6と距離計算部 2 6 0 5の 制御し、 べクトル符号帳 2 6 0 6に格納された複数のコードべクトルの中で距 離計算部 2 6 0 5にて算出された距離の最も小さくなるコードべクトルの番号 を求め、 これをゲインの符号 2 6 0 8とする。 また、 得られたゲインの符号 2 6 0 8を基に復号化べクトルを求め、 これを用いて復号化べクトル格納部 2 6 0 3の内容を更新する。 復号化ベクトルは (数式 4 3 ) により求める。
また、 更新の方法 (数式 4 4 ) を用いる。
一方、音声複号化装置器では、予め音声符号化装置と同様のべクトル符号帳、 予測係数格納部、 復号化ベクトル格納部を用意しておき、 符号器から伝送され てきたゲインの符号に基づいて、 符号器の比較部の復号化べクトル作成と復号 化べクトル格納部の更新の機能によつて復号化を行なう。
このような構成された実施の形態によれば、 音源のインデクスに対応する 2 つの合成音と入力音声からゲインの量子化による歪を評価しながらべクトル量 子化でき、 パラメ一夕変換部の特徴によりパワーと各ゲインの相対的大きさの 相関を利用することが出来るようになり、 複号化ベクトル格納部、 予測係数格 納部、 ターゲット抽出部、 距離計算部の特徴によりパヮ一と 2つのゲインの相 対的関係の間の相関を利用したゲインの予測符号化が実現でき、 これによりパ ラメ一夕同志の相関を十分に利用できる。
(実施の形態 1 8 )
図 2 7は、 本実施の形態におけるノイズ削減装置の主要部の機能ブロック図 である。 このノイズ削減装置を上述した音声符号化装置に装備する。 例えば、 図 1 3に示す音声符号化装置においてバッファ 1 3 0 1の前段に設置する。 図 2 7に示すノイズ削減装置は、 八ノ0変換部2 7 2、 ノイズ削減係数格納 部 2 7 3、 ノイズ削減係数調整部 2 7 4、 入力波形設定部 2 7 5、 L P C分析 部 2 7 6、 フーリエ変換部 2 7 7、 ノイズ削減 スペクトル補償部 2 7 8、 ス ぺクトル安定部 2 7 9、 逆フーリエ変換部 2 8 0、 スぺクトル強調部 2 8 1、 波形整合部 2 8 2、 ノイズ推定部 2 8 4、 ノイズスペクトル格納部 2 8 5、 前 スぺクトル格納部 2 8 6、 乱数位相格納部 2 8 7、 前波形格納部 2 8 8、 最大 パワー格納部 2 8 9、 を備えている。 始めに初期設定について説明する, (表 10) に、 固定パラメ一夕の名称と 設定例を示す。
表 10
Figure imgf000088_0001
また、 乱数位相格納部 287には、 位相を調整するための位相データを格納 しておく。 これらは、 スペクトル安定化部 279において、 位相を回転させる ために用いられる。 位相データが 8種類の場合の例を (表 1 1) に示す。
位相デ- -夕
( — 0. 51, 0. 86) , ( 0. 98, - 0. 17) ( 0. 30, 0. 95) , (-0. 53, - 0. 84) ( — 0 . 9 4, 0 . 3 4 ) 0 . 7 0, 0 . 7 1 ) ( — 0 . 2 2, 0 . 9 7 ) 0 . 3 8 , - 0 . 9 2 ) さらに、 上記位相デ一夕を用いるためのカウンタ一 (乱数位相カウンター) も、 乱数位相格納部 2 8 7に格納しておく。 この値は、 予め 0に初期化して格 納しておく。
次に、 スタティックの R AM領域を設定する。 すなわち、 ノイズ削減係数格 納部 2 7 3、 ノイズスペクトル格納部 2 8 5、 前スペクトル格納部 2 8 6、 前 波形格納部 2 8 8、 最大パヮ一格納部 2 8 9をクリアする。 以下に、 各格納部 の説明と設定例を述べる。
ノイズ削減係数格納部 2 7 3は、 ノイズ削減係数を格納するエリアであり、 初期値として 2 0 . 0を格納しておく。 ノイズスペクトル格納部 2 8 5は、 平 均ノイズパワーと、 平均ノイズスペクトルと、 1位候補の補償用ノイズスぺク トルと 2位候補の補償用ノイズスぺクトルとそれぞれの周波数のスぺクトル値 が、 何フレーム前に変化したかを示すフレーム数 (持続数) を、 各周波数毎に 格納するエリアであり、 平均ノイズパワーに十分大きな値、 平均ノイズスぺク トルに指定最小パワー、 補償用ノイズスぺクトルと持続数としてそれぞれに充 分大きな数を初期値として格納しておく。
前スぺクトル格納部 2 8 6は、 補償用ノイズパワー、 以前のフレームのパヮ 一 (全域、 中域) (前フレームパワー) 、 以前のフレームの平滑化パワー (全 域、 中域) (前フレーム平滑化パワー) 、 及びノイズ連続数を格納するエリア であり、 補償用ノイズパワーとして十分大きな値を、 前フレームパワー、 全フ レーム平滑化パワーとしていずれも 0 . 0を、 またノイズ連続数としてノイズ 基準連続数を格納しておく。
前波形格納部 2 8 8は、 出力信号を整合させるための、 前のフレームの出力 信号の、 最後の先読みデ一夕長分のデータを格納するエリアであり、 初期値と して全てに 0を格納しておく。 スペクトル強調部 2 8 1は、 A R MA及び高域 強調フィルタリングを行なうが、 そのためのそれぞれのフィル夕一の状態をい ずれも 0にクリアしておく。 最大パワー格納部 2 8 9は、 入力された信号のパ ヮ一の最大を格納するエリアであり、 最大パワーとして 0を格納しておく。 次にノイズ削減アルゴリズムについて、 図 2 7を用いてブロック毎に説明す る。
まず、 音声を含むアナログ入力信号 2 7 1を AZD変換部 2 7 2で AZD変 換し、 1フレーム長 +先読みデータ長 (上記設定例では、 1 6 0 + 8 0 = 2 4 0ポイント) の分だけ入力する。 ノイズ削減係数調節部 2 7 4は、 ノイズ削減 係数格納部 2 7 3に格納されたノイズ削減係数と指定ノイズ削減係数とノイズ 削減係数学習係数と補償パワー上昇係数とを基に、 (数式 4 9 ) により、 ノィ ズ削減係数並びに補償係数を算出する。 そして、 得られたノイズ削減係数をノ ィズ削減係数格納部 2 7 3に格納するとともに、 AZD変換部 2 7 2で得られ た入力信号を、 入力波形設定部 2 7 5へ送り、 さらに補償係数とノイズ削減係 数を、 ノイズ推定部 2 8 4とノイズ削減 スぺクトル補償部 2 7 8へ送る。
q = q * C + Q * (l - C )
r = Q / q ^ D ( 4 9 ) q : ノイズ削減係数
Q:指定ノイズ削減係数
C : ノイズ削減係数学習係数
r :補償係数
D:補償パワー上昇係数
なお、 ノイズ削減係数はノイズを減ずる割合を示した係数、 指定ノイズ削減 係数は予め指定された固定削減係数、 ノィズ削減係数学習係数はノィズ削減係 数の指定ノイズ削減係数に近づける割合を示した係数、 補償係数はスぺクトル 補償における補償パワーを調節する係数、 補償パワー上昇係数は補償係数を調 節する係数である。
入力波形設定部 2 7 5においては、 AZD変換部 2 7 2からの入力信号を、 F F T (高速フーリエ変換) することができるように、 2の指数乗の長さを持 つメモリ配列に、 後ろ詰めで書込む。 前の部分は 0を詰めておく。 前述の設定 例では、 2 5 6の長さの配列に 0〜 1 5まで 0を書込み、 1 6〜2 5 5まで入 力信号を書込む。 この配列は、 8次の F F Tの際に実数部として用いられる。 また、 虚数部として、 実数部と同じ長さの配列を用意し、 全てに 0を書込んで おく。
L P C分析部 2 7 6においては、 入力波形設定部 2 7 5で設定した実数部ェ リアに対してハミング窓を掛け、 窓掛け後の波形に対して自己相関分析を行つ て自己相関係数を求め、 自己相関法に基づく L P C分析を行い、 線形予測係数 を得る。 さらに、 得られた線形予測係数をスペクトル強調部 2 8 1に送る。 フ一リエ変換部 2 7 7は、 入力波形設定部 2 7 5で得られる実数部、 虚数部 のメモリ配列を用いて、 F F Tによる離散フーリエ変換を行う。 得られた複素 スぺクトルの実数部と虚数部の絶対値の和を計算することによって、 入力信号 の疑似振幅スぺクトル (以下、 入カスペクトル) を求める。 また、 各周波数の 入力スペクトル値の総和 (以下、 入力パワー) を求め、 ノイズ推定部 2 8 4へ 送る。 また、 複素スペクトルそのものを、 スペクトル安定部 2 7 9へ送る。 次に、 ノイズ推定部 2 8 4における処理を説明する。
ノイズ推定部 2 8 4は、 フーリエ変換部 2 7 7で得られた入力パワーと最大 パワー格納部 2 8 9に格納された最大パワーの値とを比較し、 最大パワーの方 が小さい場合は、 最大パワー値を入力パワー値として、 その値を最大パワー格 納部 2 8 9に格納する。 そして、 以下の 3つうち少なくとも一つに該当する場 合はノイズ推定を行い、 全て満たさない場合はノイズ推定は行わない。
( 1 ) 入力パワーが、 最大パワーに無音検出係数を乗じた値よりも小さい。
( 2 ) ノイズ削減係数が、 指定ノイズ削減係数に 0 . 2を加えたものより大き い。
( 3 ) 入力パワーが、 ノイズスペクトル格納部 2 8 5から得られる平均ノイズ パワーに 1 . 6を乗じたものより小さい。
ここで、 ノイズ推定部 2 8 4におけるノイズ推定アルゴリズムを述べる。 まず、 ノイズスペクトル格納部 2 8 5に格納されている 1位候補、 2位候補 の全ての周波数の持続数を更新する (1を加算する) 。 そして、 1位候補の各 周波数の持続数を調べ、 予め設定したノイズスぺクトル基準持続数より大きい 場合は、 2位候補の補償用スペクトルと持続数を 1位候補とし、 2位候補の補 償用スぺクトルを 3位候補の補償用スぺクトルとし持続数を 0とする。ただし、 この 2位候補の補償用スぺクトルの入れ替えにおいては、 3位候補を格納せず、 2位候補を若干大きくしたもので代用することによって、 メモリを節約するこ とができる。 本実施の形態では、 2位候補の補償用スペクトルを 1 . 4倍した ものを代用することとする。
持続数の更新の後に、 各周波数毎に、 補償用ノイズスペクトルと入カスペク トルとの比較を行う。 まず、 各周波数の入力スペクトルを 1位候補の補償用ノ ィズスペクトルと比較し、 もし入力スペクトルの方が小さい場合は、 1位候補 の補償用ノイズスぺクトルと持続数を 2位候補とし、 入カスペクトルを 1位候 補の補償用スぺクトルとし 1位候補の持続数は 0とする。 前記の条件以外の場 合は、 入カスペクトルと 2位候補の補償用ノイズスぺクトルとの比較を行い、 もし入カスペクトルの方が小さい場合は、 入カスペクトルを 2位候補の補償用 スペクトルとし 2位候補の持続数は 0とする。 そして、 得られた 1、 2位候補 の補償用スぺクトルと持続数を補償用ノイズスぺクトル格納部 2 8 5に格納す る。 また、 同時に、 平均ノイズスペクトルも、 次の (数式 5 0 ) にしたがって 更新する。 si = i^ g + 5 * (1 - g ) ( s o ) s :平均ノイズスぺクトル、 S :入カスペクトル
g : 0. 9 (入力パワーが平均ノイズパワーの半分より大きい場合)
0. 5 (入力パワーが平均ノイズパワーの半分以下の場合) i :周波数の番号
なお、 平均ノイズスペクトルは、 疑似的に求めた平均のノイズスペクトルで あり、 (数式 5 0 ) における係数 gは、 平均ノイズスペクトルの学習の早さを 調節する係数である。 すなわち、 入力パワーがノイズパワーと比較して小さい 場合は、 ノイズのみの区間である可能性が高いとして学習速度を上げ、 そうで ない場合は、 音声区間中である可能性があるとして学習速度を下げる効果を持 つ係数である。
そして、 平均ノイズスペクトルの各周波数の値の総和を求め、 これを平均ノ ィズパワーとする。 補償用ノイズスペクトル、 平均ノイズスペクトル、 平均ノ ィズパワーは、 ノイズスぺクトル格納部 2 8 5に格納する。
また、 上記ノイズ推定処理において、 1つの周波数のノイズスペクトルを複 数の周波数の入カスペクトルと対応させれば、 ノイズスぺクトル格納部 2 8 5 を構成するための R AM容量を節約することができる。 例として、 本実施の形 態の 2 5 6ポイントの F F Tを用いる場合に、 1つの周波数のノイズスぺクト ルを 4つの周波数の入カスペクトルから推定するときの、 ノイズスぺクトル格 納部 2 8 5の R AM容量を示す。 (疑似) 振幅スぺクトルが周波数軸上で左右 対称であることを考慮すると、 全ての周波数で推定する場合は 1 2 8個の周波 数のスペクトルと持続数を格納するので、 1 2 8 (周波数) X 2 (スペクトル と持続数) X 3 (補償用の 1 、 2位候補、 平均) で計 7 6 8 Wの R AM容量が 必要になる。
これに対して、 1つの周波数のノイズスぺクトルを 4つの周波数の入カスペ クトルと対応させる場合は、 3 2 (周波数) X 2 (スペクトルと持続数) X 3 (補償用の 1、 2位候補、 平均) で計 1 9 2 Wの R AM容量でよいことになる。 この場合、 ノイズスペクトルの周波数解像度は低下することになるが、 上記 1 対 4の場合は、 殆ど性能の劣化がないことを実験により確認している。 また、 この工夫は、 1つの周波数のスぺクトルでノイズスぺクトルを推定するもので はないから、 定常音 (サイン波、 母音等) が長時間続いた場合に、 そのスぺク トルをノイズスぺクトルと誤推定することを防ぐ効果もある。
次に、ノイズ削減 /スぺクトル補償部 2 7 8における処理について説明する。 入カスペクトルから、 ノイズスぺクトル格納部 2 8 5に格納されている平均 ノイズスぺクトルにノイズ削減係数調節部 2 7 4で得られたノイズ削減係数を 乗じたものを引く (以後、 差スペクトル) 。 上記ノイズ推定部 2 8 4の説明に おいて示したノイズスぺクトル格納部 2 8 5の R AM容量の節約を行った場合 は、 入カスペクトルに対応する周波数の平均ノイズスぺクトルにノイズ削減係 数を乗じたものを引く。 そして、 差スペクトルが負になった場合には、 ノイズ スぺクトル格納部 2 8 5に格納された補償用ノイズスぺクトルの 1位候補に、 ノイズ削減係数調整部 2 7 4で求めた補償係数を乗じたものを代入することに より補償する。 これを、 全ての周波数について行う。 また、 差スペクトルを補 償した周波数が分るように、 周波数毎にフラグデータを作成する。 例えば、 各 周波数毎に 1つのエリアがあり、 補償しない時は 0、 補償したときは 1を代入 する。 このフラグデ一夕は、 差スペクトルと共に、 スペクトル安定化部 2 7 9 へ送られる。 また、 フラグデ一夕の値を調べることによって補償した総数 (補 償数) を求め、 これもスペクトル安定部 2 7 9へ送る。
次に、 スぺクトル安定部 2 7 9における処理について説明する。 なお、 この 処理は、 主に音声の含まれていない区間の異音感低減のために機能する。 まず、 ノイズ削減 スぺクトル補償部 2 7 8から得られた各周波数の差スぺ クトルの和を計算し、 現フレームパワーを求める。 現フレームパワーは全域と 中域の 2種類を求める。 全域は全ての周波数 (全域と呼ぶ、 本実施の形態では 0〜1 2 8まで) について求め、 中域は聴感的に重要な中ごろの帯域 (中域と 呼ぶ、 本実施の形態では 1 6〜 7 9まで) について求める。
同様に、 ノイズスぺクトル格納部 2 8 5に格納された補償用ノイズスぺクト ルの 1位候補についての和を求め、 これを現フレームノイズパヮ一 (全域、 中 域) とする。 ここで、 ノイズ削減 スペクトル補償部 2 7 8から得られた補償 数の値を調べ、 十分大きい場合、 且つ、 以下の 3条件のうち少なくとも 1っ満 たす場合に、 現フレームがノイズのみの区間と判断して、 スペクトルの安定化 処理を行う。
( 1 ) 入力パワーが、 最大パワーに無音検出係数を乗じた値よりも小さい。
( 2 ) 現フレームパワー (中域) が、 現フレームノイズパワー (中域) に 5 . 0を乗じた値より小さい。
( 3 ) 入力パワーが、 ノイズ基準パワーよりも小さい。
安定化処理を行なわない場合は、 前スぺクトル格納部 2 8 6に格納されたノ ィズ連続数が正の時に 1を減じ、 また現フレームノイズパワー (全域、 中域) を前フレームパワー (全域、 中域) とし、 それぞれを前スペクトル格納部 2 8 6に格納して、 位相拡散処理に進む。
ここで、 スペクトル安定化処理について説明する。 この処理の目的は、 無音 区間 (音声の無いノイズのみの区間) のスペクトルの安定化とパワー低減を実 現することである。 処理は 2種類あり、 ノイズ連続数がノイズ基準連続数より 小さい場合は (処理 1) を、 以上の場合は (処理 2) を行なう。 2つの処理を 以下に示す。
(処理 1)
前スぺクトル格納部 286に格納されたノイズ連続数に 1を加算し、 また現フ レームノイズパワー (全域、 中域) を前フレームパワー (全域、 中域) とし、 それぞれを前スぺクトル格納部 286に格納して、 位相調整処理へ進む。
(処理 2)
前スぺクトル格納部 286に格納された前フレームパワー、 前フレーム平滑化 パワー、 更に固定係数である無音パワー減少係数を参照し、 (数式 5 1) にし たがってそれぞれを変更する。
Dd80 = Di/80*0.8 + 80*0.2*P
D80 = Z) 80*0.5 + /) 80*0.5
Ddl29 = Ddl29*0.8 + ^4129*0.2*尸 (5 l)
D129 = 2)129*0.5 + Ddl29*0.5 脑 0 :前フレ- -ム平滑化パワー(中域)
細 : 前フレー -ムパワー(中域)
Ddl29 :前フレ- -ム平滑化パヮ(全域)
DY19 :前フレー -ムパワー(全域)
^80 :現フレー -ムノイズパワー(中域)
129 :現フレー -ムノイズパワー(全域)
次に、 これらのパワーを差スペクトルに反映させる。 そのために、 中域に乗 ずる係数 (以後、 係数 1) と全域に乗ずる係数 (以後、 係数 2) の 2つの係数 を算出する。 まず、 以下の (数式 52) に示す式で係数 1を算出する。
rl= 扇/遞 ( >0の時) 1.0 ( 0の時)
(52) rl 係数 1
D80 :前フレームパワー(中域)
A80 :現フレームノイズパワー(中域)
係数 2は、 係数 1の影響を受けるので、 求める手段は多少複雑になる。 手順 を以下に示す。
(1) 前フレーム平滑化パワー (全域) が前フレームパワー (中域) より小さ い場合、 または、 現フレームノイズパワー (全域) が現フレームノイズパワー
(中域) よりも小さい場合は (2) へ。 それ以外の場合は (3) へ。
(2) 係数 2は 0. 0とし、 前フレームパワー (全域) を前フレームパワー (中 域) として、 (6) へ。
(3) 現フレームノイズパワー (全域) が現フレームノイズパワー (中域) と 等しい場合は (4) へ。 異なる場合は (5) へ。
(4) 係数 2を 1. 0とし、 (6) へ。
(5) 以下の (数式 5 3) により係数 2を求め、 (6) へ。 rl = ( 129 - Z)80) / (^129一 80) (53) r2:係数 2
D129 :前フレームパワー(全域)
£)80 : 前フレームパワー(中域)
129 :現フレームノイズパワー(全域)
80 :現フレームノイズパワー(中域)
(6) 係数 2算出処理終了。
上記アルゴリズムにより得られた係数 1、 2は、 いずれも上限を 1. 0に、下 限を無音パワー減少係数にクリッピングする。そして、 中域の周波数(本例で は 1 6〜7 9 ) の差スぺクトルに係数 1を乗じて得られた値を差スぺクトルと し、 さらに、 その差スペクトルの全域から中域を除いた周波数 (本例では 0〜 1 5、 8 0〜 1 2 8 ) の差スペクトルに係数 2を乗じて得られた値を差スぺク トルとする。 それに伴い、 前フレームパワー (全域、 中域) を以下の (数式 5 4 ) によって変換する。
D80 = ^80*rl
D129 = D80 + (A129一 A80)* r2 ( ί> 4 )
rl:係数 1
r2 :係数 2
D&Q: 前フレームパワー(中域)
A80 :現フレームノイズパワー(中域)
£>129 :前フレームパワー(全域)
^4129 :現フレームノイズパワー(全域)
こうして得られた各種パワーデータ等を全て前スぺクトル格納部 2 8 6に格 納し、 (処理 2 ) を終わる。
以上の要領で、 スぺクトル安定部 2 7 9におけるスぺクトルの安定化が行わ れる。
次に、 位相調整処理について説明を行う。 従来のスペクトルサブトラクショ ンでは、 位相は原則として変更しないが、 本実施の形態では、 その周波数のス ぺクトルが削減時に補償された場合に、 位相をランダムに変更する処理を行な う。 この処理により、 残ったノイズのランダム性が強くなるので、 聴感的に悪 印象を与えにくくなるという効果が得られる。
まず、 乱数位相格納部 2 8 7に格納された乱数位相カウンタ一を得る。 そし て、 全ての周波数のフラグデータ (補償の有無を示したデータ) を参照して、 補償している場合は、 以下の (数式 55) により、 フーリエ変換部 277で得 られた複素スぺクトルの位相を回転させる。
B s = Si^ Rc - Ti* Rc + 1
Bt = Si^ Rc + 1 + Ti^ Rc
Si = Bs (55)
Ti = Bt
Si、 Ti :複素スペクトル、 i :周波数を示すインデクス
R :乱数位相データ、 c :乱数位相カウンター
Bs, Bt :計算腰レジスタ
(数式 55) においては、 2つの乱数位相デ一夕をペアで使用している。 し たがって、上記処理を 1回行なう毎に、乱数位相カウンターを 2ずつ増加させ、 上限 (本実施の形態では 16) になった場合は 0とする。 なお、 乱数位相カウ ン夕一は乱数位相格納部 287へ格納し、 得られた複素スペクトルは、 逆フー リエ変換部 280へ送る。 また、 差スペクトルの総和を求め (以下、 差スぺク トルパワー) 、 これをスペクトル強調部 28 1へ送る。
逆フ一リエ変換部 280では、 スぺクトル安定部 279で得られた差スぺク トルの振幅と複素スぺクトルの位相とに基づき、 新たな複素スぺクトルを構成 し、 FFTを用いて逆フーリエ変換を行う。 (得られた信号を第 1次出力信号 と呼ぶ。)そして、得られた第 1次出力信号をスペクトル強調部 28 1へ送る。 次に、 スぺクトル強調部 28 1における処理について説明する。
まず、 ノイズスペクトル格納部 285に格納された平均ノイズパワーと、 ス ぺクトル安定部 279で得られた差スぺクトルパワーと、 定数であるノイズ基 準パワーを参照して、 MA強調係数と AR強調係数を選択する。 選択は、 以下 の 2つの条件を評価することにより行う。 (条件 1)
差スぺクトルパワーがノイズスぺクトル格納部 285に格納された平均ノイズ パワーに 0.6を乗じた値よりも大きく、 且つ、 平均ノイズパワーがノィ ズ基 準パワーよりも大きい。
(条件 2)
差スぺクトルパワーが平均ノイズパワーより大きい。
(条件 1) を満たす場合は、 これを 「有声区間」 とし、 MA強調係数を MA 強調係数 1一 1とし、 A R強調係数を A R強調係数 1一 1とし、 高域強調係数 を高域強調係数 1とする。 また、 (条件 1) を満たさず、 (条件 2) を満たす 場合は、 これを 「無声子音区間」 とし、 MA強調係数を MA強調係数 1—0と し、 AR強調係数を AR強調係数 1一 0とし、 高域強調係数を 0とする。 また、 (条件 1) を満たさず、 (条件 2) を満たさない場合はこれを 「無音区間、 ノ ィズのみの区間」 とし、 M A強調係数を MA強調係数 0とし、 A R強調係数を AR強調係数 0とし、 高域強調係数を高域強調係数 0とする。
そして、 L PC分析部 276から得られた線形予測係数と、 上記 MA強調係 数、 AR強調係数を用いて、 以下の (数式 56) の式に基づき、 極強調フィル 夕一の MA係数と AR係数とを算出する。
(ma)i = ai* β'
ヽ. .— i (56)
a(ar)i = αι*γ
(ma)i : MA係数
a(ar)i : AR係数
cd :線形予測係数
β: ΜΑ強調係数
γ : AR強調係数
i :番号 そして、逆フ一リエ変換部 2 8 0において得られた第 1次出力信号に対して、 上記 MA係数と AR係数とを用いて極強調フィル夕一を掛ける。 このフィルタ —の伝達関数を、 以下の (数式 5 7) に示す。
l + ima)1 xZ— 1 + a(ma ) x Z ^ +-'-+ ma)j x Z~J
(5 7)
1 + (ar)1 x Z" + a(ar)2 xZ +•••+a(ar)j Z
a{ma) : MA係数
a(ar)! : AR係数
j :次数
更に、 高域成分を強調するために、 上記高域強調係数を用いて、 高域強調フ ィル夕一を掛ける。 このフィル夕一の伝達関数を、 以下の (数式 5 8) に示す。
1 - όΖ -1 (58)
δ :高域強調係数
上記処理によって得られた信号を第 2次出力信号と呼ぶ。 なお、 フィルター の状態は、 スぺクトル強調部 28 1の内部に保存される。
最後に、 波形整合部 2 8 2において、 スペクトル強調部 2 8 1で得られた第 2次出力信号と、 前波形格納部 28 8に格納された信号とを、 三角窓によって 重ね合せて出力信号を得る。 更に、 この出力信号の最後の先読みデータ長分の デ一夕を、前波形格納部 2 88に格納する。 このときの整合方法を、以下の(数 式 5 9) に示す。
Oj = ( X Dj + (L- )xZ )/L ( = 0〜レ 1)
0-
Figure imgf000101_0001
£〜 + M— 1)
Zj = oM+l = o〜 -l)
(5 9)
Oj :出力信号
Dj:第 2次出力信号 zi :出力信号
L :先読みデ一夕長
Μ :フレーム長
ここで注意が必要なのは、 出力信号としては先読みデータ長 +フレーム長分 のデータが出力される力 このうち信号として扱うことができるのは、 データ の始端からフレーム長の長さの区間のみということである。 なぜなら、 後ろの 先読みデータ長のデータは、 次の出力信号を出力するときに書き換えられるか らである。 ただし、 出力信号の全区間内では連続性は補償されるので、 L P C 分析やフィルター分析等の周波数分析には使用することができる。
このような実施の形態によれば、 音声区間中でも音声区間外でもノイズスぺ クトル推定を行うことができ、 音声がどのタイミングでデータ中に存在するか が明らかでない場合でもノイズスぺクトルを推定することができる。
また、 入力のスぺクトル包絡の特徴を線形予測係数で強調することができ、 ノイズレベルが高い場合でも音質の劣化を防ぐことが出来る。
また、 ノイズのスペクトルを平均と最低の 2つの方向から推定でき、 より的 確な削減処理を行うことができる。
また、 ノイズの平均スペクトルを削減に用いることによって、 より大きくノ ィズスペクトルを削減することができ、 さらに、 補償用スペクトルを別に推定 したことにより、 より的確な補償を行うことができる。
そして、 音声の含まれていないノイズのみの区間のスぺクトルをスム一ジン グすることができ、 同区間のスペクトルが、 ノイズ削減のために極端なスぺク トル変動による異音感を防ぐことができる。
そして、 補償された周波数成分の位相にランダム性を持たせることができ、 削減できずに残ったノイズを、 聴感的に異音感の少ないノイズに変換させるこ とができる。 また、 音声区間においては、 聴感的により適当な重み付けができるようにな り、 無音区間や無声子音区間においては、 聴感重み付けによる異音感を抑える ことができる。 産業上の利用可能性
以上のように、 本発明にかかる音源べクトル生成装置並びに音声符号化装置 及び音声復号化装置は、 音源ベクトルの探索に有用であり、 音声品質の向上に 適している。

Claims

請 求 の 範 囲
1 . 複数個のシードを格納するシード格納手段と、 シードの値に応じて異な るべクトル系列を出力する発振器と、 前記シード格納手段から前記発振器へ供 給するシードを切替える切替え手段と、 を具備する音源べクトル生成装置。
2 . 請求項 1記載の音源べクトル生成装置において、
前記発振器が、非線形発振器であることを特徴とする音源べクトル生成装置。
3 . 請求項 2記載の音源べクトル生成装置において、
前記非線形発振器が、 非線形ディジタルフィル夕であることを特徴とする音 源べクトル生成装置。
4 . 請求項 3記載の音源べクトル生成装置において、
前記非線形ディジタルフィルタは、
非線形加算特性を有する加算器と、 前記加算器出力が状態変数として順次 転送される複数の状態変数保持部と、 前記各状態変数保持部から出力された状 態変数に対してゲインを乗じて乗算値を前記加算器へ出力する複数の乗算器と を有し、
前記状態変数保持部は、 前記シード格納手段から読出されたシ一ドが前記 状態変数の初期値として与えられ、
前記加算器は、 外部から供給されるべクトル系列と前記乗算器の出力する 乗算値とを入力値とし、 前記入力値の総和に対して前記非線形加算特性にした がった加算器出力を発生し、
前記乗算器は、 ディジタルフィル夕の極が Z平面における単位円外に存在 するようにゲインが固定されている、ことを特徴とする音源べクトル生成装置。
5 . 請求項 4記載の音源べクトル生成装置において、 前記非線形ディジ夕ルフィル夕は、
前記状態変数保持部が 2段構成で、 これら状態変数保持部の出力に前記乗 算器がパラレルに接続される 2次全極構造を有し、
前記加算器の非線形加算特性が 2の補数特性である、 ことを特徴とする音 源べクトル生成装置。
6 . 過去の音源ベクトルを格納する音源格納手段と、 前記音源ベクトルから 読み出された 1つ又は複数の過去の音源べクトルに対して外部より与えられる インデクスに応じて異なる加工を加えてランダムな新しい音源べクトルを生成 する音源べクトル加工手段と、 前記音源べクトル加工手段に与えるインデクス を切替える切替手段と、 を具備した音源ベクトル生成装置。
7 . 請求項 6記載の音源べクトル生成装置において、
前記音源べクトル加工手段は、
前記インデクスに応じて過去の音源べクトルに加える処理内容を決定する 手段と、 前記音源格納手段から読み出された過去の音源べクトルに対して決定 した処理内容に応じた処理を順次実行する複数の処理部と、 を具備する音源べ クトル生成装置。
8 . 請求項 7記載の音源べクトル生成装置において、
前記複数の処理部は、
前記音源格納手段の異なる位置から異なる長さの要素べクトルを読み出す 処理を行う読出し処理部と、 読み出し処理後の複数個のべクトルを逆順に並べ 換える処理を行う逆順化処理部と、 逆順化処理後の複数個のべクトルにそれぞ れ異なるゲインを乗じる処理を行う乗算処理部と、 乗算処理後の複数個のべク トルのべクトル長を短くする処理を行う間引き処理部と、 間引き処理後の複数 個のべクトルのべクトル長を長くする処理を行う内挿処理部と、 内挿処理後の 複数個のべクトルを加算する処理を行う加算処理部と、 で形成されるグループ 力 選択される処理部を含むことを特徴とする音源べクトル生成装置。
9 . 複数個の固定波形を格納する固定波形格納手段と、 前記固定波形格納手 段から読み出された前記複数の固定波形を固定波形毎に任意の始端位置に合せ て配置する固定波形配置手段と、 前記固定波形配置手段で配置された各固定波 形を加算して音源べクトルを生成する加算手段と、 を具備する音源べクトル生 成装置。
1 0 . 請求項 9記載の音源べクトル生成装置において、
前記固定波形配置手段は、
前記固定波形毎に固定波形の始端位置の候補となる複数の始端候補位置の 情報が登録されたテーブルと、 固定波形の始端位置の組合せ情報に基づいて前 記テーブル内の複数の始端候補位置から前記各固定波形の始端位置を選択する 手段と、 前記各固定波形を選択された始端位置に配置する手段と、 を具備する ことを特徴とする音源べクトル生成装置。
1 1 . 請求項 9記載の音源べクトル生成装置において、
前記固定波形配置手段は、 前記各固定波形の始端候補位置情報を代数的に生 成する、 ことを特徴とする音源ベクトル生成装置。
1 2 . 複数個のシードを格納するシード格納手段と、 シードの値に応じて異 なるべクトル系列を出力する発振器と、 前記発振器から出力されるべクトル系 列を音源べクトルとして L P C合成して合成音を生成する合成フィルタと、 前 記シード格納手段から前記発振器へ供給するシ一ドを切替える一方、 各シ一ド に対応して生成された合成音の歪みを評価して評価値が最大になるシード番号 を特定する探索手段と、 を具備した音声符号化装置。
1 3 . 請求項 1 2記載の音声符号化装置において、
前記発振器が、 非線形ディジタルフィル夕であることを特徴とする音声符号 化装置。
1 4 . 請求項 1 3記載の音声符号化装置において、
前記非線形ディジタルフィルタは、
非線形加算特性を有する加算器と、 前記加算器出力が状態変数として順次 転送される複数の状態変数保持部と、 前記各状態変数保持部部から出力された 状態変数に対してゲインを乗じて乗算値を前記加算器へ出力する複数の乗算器 とを有し、
前記状態変数保持部は、 前記シード格納手段から読出されたシードが前記 状態変数の初期値として与えられ、
前記加算器は、 外部から供給されるべクトル系列と前記乗算器の出力する 乗算値とを入力値とし、 前記入力値の総和に対して前記非線形加算特性にした がった加算器出力を発生し、
前記乗算器は、 ディジタルフィル夕の極が Z平面における単位円外に存在 するようにゲインが固定されている、 ことを特徴とする音声符号化装置。
1 5 . 請求項 1 2記載の音声符号化装置において、
音声符号化の対象となる入力音声信号が格納されるバッファと、 前記バッフ ァ内の処理フレームに対して線形予測分析を行い線形予測係数 (L P C ) を求 め、 求めた線形予測係数を線スペクトル対 (L S P ) に変換する L P C分析手 段と、 前記 L P C分析手段で生成された処理フレームに関する線スぺクトル対 の他に、 複数の線スペクトル対を追加生成する L S P追加手段と、 前記 L P C 分析手段と前記 L S P追加手段で生成された全ての線スぺクトル対について量 子化 ·復号化し、 全ての線スぺクトル対について復号化 L S Pを生成する量子 化 ·複号化手段と、 前記複数の複号化 L S Pの中から最も異音が少なくなる復 号化 L S Pを選択する手段と、 選択した復号化 L S Pを符号化する手段と、 を 備えた音声符号化装置。
1 6 . 請求項 1 5記載の音声符号化装置において、 前記 L P C分析手段は、
前記バッファ内の先読み区間に対して線形予測分析を行って前記先読み区 間に対する線形予測係数を求め、 求めた線形予測係数から前記先読み区間に対 する線スぺクトル対を生成し、
前記 L S P追加手段は、
前記処理フレームの線スぺクトル対と前記先読み区間に対する線スぺクト ル対と前フレームの線スぺクトル対とを線形補間して量子化対象とする線スぺ クトル対を複数個追加する、 ことを特徴とする音声符号化装置。
1 7 . 請求項 1 6記載の音声符号化装置において、
前記量子化 ·復号化手段は、
線スぺクトル対をべクトル量子化してコードべクトルに変換するための量 子化テーブルと、 前記量子化テ一ブルから量子化対象の線スぺクトル対に対応 したコードべクトルを読み出してべクトル量子化 L S Pを生成する L S P量子 化手段と、 前記し S P量子化手段で生成されたべクトル量子化 L S Pを復号化 して復号化 L S Pを生成する L S P復号化手段と、 前記量子化テーブルから読 み出されるコードべクトルにゲインを乗じる乗算手段と、 前記乗算手段のゲイ ンを前フレームで採用された前記乗算手段のゲインの大きさと前記 L S P量子 化手段における L S P量子化誤差の大きさとに基づいて適応的に調節する手段 と、 を具備する音声符号化装置。
1 8 . 過去の音源べクトルを格納する音源格納手段と、 前記音源べクトルか ら読み出された 1つ又は複数の過去の音源べクトルに対してィンデクスに応じ て異なる加工を加えてランダムな新しい音源べクトルを生成する音源べクトル 加工手段と、 前記音源べクトル加工手段から出力される音源べクトルを L P C 合成して合成音を生成する合成フィル夕と、 前記音源べクトル加工手段に与え るインデクスを切替える一方、 各インデクスに対応して生成された合成音の歪 みを評価することで評価値が最大になるィンデクス番号を特定する探索手段と、 を具備した音声符号化装置。
1 9 . 請求項 1 8記載の音声符号化装置において、
前記音源べクトル加工手段は、
前記インデクスに応じて過去の音源べクトルに加える処理内容を決定する 手段と、 前記音源格納手段から読み出された過去の音源べクトルに対して決定 した処理内容に応じた処理を順次実行する複数の処理部と、 を具備する音声符 号化装置。
2 0 . 直前の音源情報が適応ベクトルとして格納される適応符号帳と、 ラン ダムな雑音べクトルを発生させる雑音符号帳と、 前記適応べクトルと前記雑音 べクトルをそれぞれ L P C合成する合成フィル夕とを備えた C E L P型の音声 符号化装置であり、
前記雑音符号帳は、 複数個のシードを格納するシード格納手段と、 シード の値に応じて異なるべクトル系列を出力する発振器と、 前記シ一ド格納手段か ら前記発振器へ供給するシードを切替える切替え手段とを具備する音源べクト ル生成装置で構成される、 ことを特徴とする C E L P型音声符号化装置。
2 1 . 複数個の固定波形を格納する固定波形格納手段と、 前記固定波形格納 手段から読み出された前記複数の固定波形を固定波形毎に任意の始端位置に合 せて配置する固定波形配置手段と、 前記固定波形配置手段で配置された各固定 波形を加算して音源べクトルを生成する加算手段と、 を有する音源べクトル生 成装置と、 前記加算手段から出力される音源べクトルを合成して合成音を生成 する合成フィル夕と、 前記固定波形配置手段に対して始端位置の組合せを指示 する一方、 各始端位置の組合せに対応して生成された合成音の歪みを評価する ことで評価値が最大になる始端位置の組合わせを特定する探索手段と、 を具備 した音声符号化装置。
2 2 . 請求項 2 1記載の音声符号化装置において、
前記探索手段で特定された始端位置の組合わせに対応したコード番号を音声 情報として伝送する、 ことを特徴とする音声符号化装置。
2 3 . 請求項 2 1記載の音声符号化装置において、
前記固定波形配置手段は、 前記各固定波形の始端候補位置情報を代数的に生 成する、 ことを特徴とする音声符号化装置。
2 4 . 直前の音源情報が適応ベクトルとして格納される適応符号帳と、 雑音 べクトルを発生させる雑音符号帳と、 前記適応べクトルと前記雑音べクトルを それぞれ P C合成する合成フィル夕とを備えた C E L P型の音声符号化装置 であり、
前記雑音符号帳は、 複数個の固定波形を格納する固定波形格納手段と、 前 記固定波形格納手段から読み出された前記複数の固定波形を固定波形毎に任意 の始端位置に合せて配置する固定波形配置手段と、 前記固定波形配置手段で配 置された各固定波形を加算して音源べクトルを生成する加算手段とを具備する 音源べクトル生成装置で構成されたことを特徴とする C E L P型音声符号化装
2 5 . 請求項 2 4記載の C E L P型音声符号化装置において、
前記固定波形格納手段は、
前記雑音符号帳の音源探索に用いられるターゲット信号の統計的特徴を分 折して得られた結果を反映した固定波形を格納する、 ことを特徴とする音声符 号化装置。
2 6 . 請求項 2 5記載の C E L P型音声符号化装置において、
前記固定波形格納手段は、 前記雑音符号帳の探索に用いられる評価式をコス ト関数とする学習により得た固定波形を格納する、 ことを特徴とする音声符号 化装置。
27. 請求項 24記載の CE LP型音声符号化装置において、 雑音べクトルを発生させる第 2の雑音符号帳と、 前記雑音符号帳と前記第 2 の雑音符号帳とから一つの雑音符号帳を選択する選択手段とを、 さらに具備し た CE LP型音声符号化装置。
28. 請求項 27記載の CE LP型音声符号化装置において、
前記第 2の雑音符号帳は、 複数のランダム数列を格納したべクトル格納手段 であることを特徴とする C E L P型音声符号化装置。
29. 請求項 27記載の CE LP型音声符号化装置において、
前記第 2の雑音符号帳は、 複数のパルス列を格納したパルス列格納部である ことを特徴とする C E L P型音声符号化装置。
30. 請求項 27記載の CE LP型音声符号化装置において、
前記第 2の雑音符号帳は、 前記音源べクトル生成装置と同じ構成を有してお り、 前記固定波形格納手段に格納される固定波形の個数が前記雑音符号帳と異 なることを特徴とする C E L P型音声符号化装置。
31. 請求項 27記載の CE LP型音声符号化装置において、
前記選択手段は、
前記雑音符号帳の音源採索を行った結果、 符号化歪みが最小になる音源が 検出された雑音符号帳を選択することを特徴とする C E L P型音声符号化装置。
32. 請求項 27記載の CE LP型音声符号化装置において、
前記選択手段は、
音声区間の分析結果により適応的にいずれかの雑音符号帳を選択すること を特徴とする C E L P型音声符号化装置。
33. 請求項 32記載の CE LP型音声符号化装置において、
前記選択手段は、
音声区間の分析結果が、 雑音符号帳探索を行う前に抽出されて決定された 伝送パラメ一夕であることを特徴とする C E L P型音声符号化装置。
3 4 . 請求項 3 3記載の C E L P型音声符号化装置において、
前記選択手段は、
適応符号べクトルのピッチゲインを量子化して量子化ピッチゲインを生成 するピッチゲイン量子化部を有し、
前記量子化ピッチゲインを伝送パラメ一夕として、 前記量子化ピッチゲイ ンの大きさによつて雑音符号帳を選択することを特徴とする C E L P型音声符 号化装置。
3 5 . 請求項 3 3記載の C E L P型音声符号化装置において、
前記選択手段は、
適応符号べクトルのピッチ周期を算出するピッチ周期算出器を有し、 前記ピッチ周期を伝送パラメ一夕として、 前記ピッチ周期によって雑音符 号帳を選択することを特徴とする C E L P型音声符号化装置。
3 6 . 複数個の固定波形を格納する固定波形格納手段と、 前記固定波形格納 手段に格納された固定波形毎の始端候補位置情報を有する固定波形配置手段と、 前記固定波形配置手段の始端候補位置情報に対するィンパルスを生成するィン パルス発生手段と、 音源べクトルから合成音を生成する合成フィル夕のインパ ルス応答と前記固定波形格納手段に格納されたそれぞれの固定波形とを畳み込 んで波形別ィンパルス応答を生成する波形別ィンパルス応答算出手段と、 前記 波形別ィンパルス応答の自己相関及び相互相関を計算して相関行列メモリに展 開する相関行列算出手段と、 を備えた C E L P型音声符号化装置。
3 7 . 複数個のシードを格納するシード格納手段と、 シードの値に応じて異 なるべクトル系列を出力する発振器と、 前記発振器から出力されるべクトル系 列を音源べクトルとして L P C合成して合成音を生成する合成フィル夕と、 前 記シード格納手段から前記発振器へ供給するシードを切替える一方、 各シード に対応して生成された合成音の歪みを評価することで評価値が最大になるシ一 ド番号を特定する手段と、 特定されたシ一ド番号に対して生成された合成音の 最適ゲインを求める手段と、 前記最適ゲインをべクトル量子化するべクトル量 子化手段と、 を具備した音声符号化装置。
3 8 . 請求項 3 7記載の音声符号化装置において、
前記べクトル量子化手段は、
前記最適ゲインが一方のコードベクトルとなる C E L P方式の 2つのゲイ ン情報、 適応コードべクトルゲインと雑音コードべクトルゲインをそれらの和 及び前記和に対する比率に変換して量子化対象べクトルを求めるパラメ一夕変 換手段と、 復号化コードベクトルを格納する複号化ベクトル格納手段と、 予測 係数を格納する予測係数格納手段と、 前記量子化対象ベクトル、 前記復号化コ 一ドべクトル、 及び前記予測係数を用いて夕一ゲッ卜べクトルを求める夕一ゲ ット抽出手段と、 複数のコードベクトルを格納するベクトル符号帳と、 前記予 測係数を用いて前記複数のコードべクトルと前記夕一ゲットべクトルとの距離 を計算する距離計算手段と、 前記べクトル符号帳と前記距離計算手段を制御し て前記距離を比較することにより最適なコードべクトル及び対応する番号を求 め、 前記番号を符号として出力するとともに、 前記最適なコードベクトルを用 いて前記復号化べクトルを更新する比較手段と、 を具備する音声符号化装置。
3 9 . 請求項 3 8記載の音声符号化装置において、
前記予測係数が和と前記和に対する比率との間の相関の度合いによって設定 されていることを特徴とする音声符号化装置。
4 0 . 複数個の固定波形を格納する固定波形格納手段と、 前記固定波形格納 手段から読み出された前記複数の固定波形を固定波形毎に任意の始端位置に合 せて配置する固定波形配置手段と、 前記固定波形配置手段で配置された各固定 波形を加算して音源べクトルを生成する加算手段と、 を有する音源べクトル生 成装置と、 前記加算手段から出力される音源べクトルを合成して合成音を生成 する合成フィルタと、 前記固定波形配置手段に対して始端位置の組合せを指示 する一方、 各始端位置の組合せに対応して生成された合成音の歪みを評価する ことで評価値が最大になる始端位置の組合わせを特定する手段と、 特定された 始端位置の組合わせに対して生成された合成音の最適ゲインを求める手段と、 前記最適ゲインをべクトル量子化するべクトル量子化手段と、 を具備した音声 符号化装置。
4 1 . 請求項 4 0記載の音声符号化装置において、
前記べクトル量子化手段は、
前記最適ゲインが一方のコ一ドベクトルとなる C E L P方式の 2つのゲイ ン情報、 適応コードべクトルゲインと雑音コ一ドべクトルゲインをそれらの和 及び前記和に対する比率に変換して量子化対象べクトルを求めるパラメ一夕変 換手段と、 復号化コードベクトルを格納する複号化ベクトル格納手段と、 予測 係数を格納する予測係数格納手段と、 前記量子化対象べクトル、 前記複号化コ 一ドべクトル、 及び前記予測係数を用いて夕一ゲットべクトルを求める夕ーゲ ット抽出手段と、 複数のコードベクトルを格納するベクトル符号帳と、 前記予 測係数を用いて前記複数のコードべクトルと前記ターゲットべクトルとの距離 を計算する距離計算手段と、 前記べクトル符号帳と前記距離計算手段を制御し て前記距離を比較することにより最適なコ一ドべクトル及び対応する番号を求 め、 前記番号を符号として出力するとともに、 前記最適なコードベクトルを用 いて前記復号化ベクトルを更新する比較手段と、 を具備する音声符号化装置。
4 2 . 請求項 4 1記載の音声符号化装置において、
前記予測係数が和と前記和に対する比率との間の相関の度合いによって設定 されていることを特徴とする音声符号化装置。
4 3 . 複数個のシードを格納するシード格納手段と、 シードの値に応じて異 なるべクトル系列を出力する発振器と、 前記発振器から出力されるべクトル系 列を音源べクトルとして L P C合成して合成音を生成する合成フィル夕と、 前 記シード格納手段から前記発振器へ供給するシ一ドを切替える一方、 各シ一ド に対応して生成された合成音の歪みを評価することで評価値が最大になるシー ド番号を特定する手段と、 入力音声信号からノィズ成分を除去するノィズ削減 装置と、 を具備する音声符号化装置。
4 4. 請求項 4 3記載の音声符号化装置において、
前記ノイズ削減装置は、
前記入力音声信号をディジ夕ル信号に変換する AZD変換手段と、 ノイズ 削減量を決定するノィズ削減係数を調節するノィズ削減係数調節手段と、 前記 A/D変換手段により得られる一定時間長のディジタル信号に対して線形予測 分析を行う L P C分析手段と、 前記 AZD変換手段により得られる一定時間長 のディジタル信号に対して離散フーリエ変換を行い入カスペクトルと複素スぺ クトルを得るフーリエ変換手段と、 推定されたノイズのスぺクトルを格納する ノイズスぺクトル格納手段と、 前記フーリエ変換手段により得られる入カスペ クトルと前記ノイズスぺクトル格納手段に格納されているノイズスぺクトルと を比較することによってノイズのスぺクトルを推定し、 得られたノイズスぺク トルを前記ノイズスぺクトル格納手段に格納するノイズ推定手段と、 前記ノィ ズ削減係数調節手段により得られる係数に基づいて前記ノイズスぺクトル格納 手段に格納されているノイズスぺクトルを前記フーリエ変換手段により得られ る入力スペクトルから減じ、 更に、 得られるスペクトルを調べ、 減じすぎた周 波数のスぺクトルを補償するノイズ削減 Zスぺクトル補償手段と、 前記ノイズ 削減ノスぺクトル補償手段により得られたスぺクトルを安定化処理するととも に、 前記フーリエ変換手段により得られた複素スぺクトルの位相のうち前記ノ ィズ削減 スぺクトル補償手段において補償された周波数の位相を調整するス ぺクトル安定化手段と、 前記スぺクトル安定化手段において安定化処理された スぺクトルと調整された位相スぺクトルとに基づいて逆フーリエ変換を行う逆 フーリエ変換手段と、 前記逆フーリエ変換手段により得られた信号に対してス ぺクトル強調を行うスぺクトル強調手段と、 前記スぺクトル強調手段により得 られた信号を前のフレームの信号と整合させる波形整合手段と、 を具備する音 声符号化装置。
4 5 . 請求項 4 4記載の音声符号化装置において、
前記ノイズ推定手段は、
予めノィズ区間であるかどうかの判定を行なう手段と、 ノイズであると判 定した場合には前記フ一リェ変換手段により得られる入カスペクトルを各周波 数毎に補償用ノイズスぺクトルと大小比較する手段と、 補償用ノイズスぺクト ルより小さい場合にその周波数の補償用ノイズスぺクトルを入カスペクトルと することによって補償用ノイズスぺクトルを推定する手段と、 補償用ノイズス ぺクトルより小さい場合にその周波数の補償用ノイズスぺクトルを入カスペク トルとして該入カスペクトルを一定割合で加算していくことによって平均ノィ ズスぺクトルを推定する手段と、 前記補償用ノイズスぺクトルと前記平均ノィ ズスぺクトルとをノイズスぺクトル格納手段に格納する手段と、 を具備する音 声符号化装置。
4 6 . 請求項 4 4記載の音声符号化装置において、
前記ノイズ削減 Zスぺクトル補償手段は、
前記ノィズ削減係数調節手段にて得られたノィズ削減係数を前記ノィズス ぺクトル格納手段に格納された平均ノイズスぺクトルに乗じて、 前記フーリエ 変換手段にて得られた入カスペクトルから減じ、 負のスぺクトル値になってし まった周波数に対しては前記ノイズスぺクトル格納手段に格納された補償用ノ ィズスぺクトルにより補償する、 ことを特徴とする音声符号化装置。
4 7 . 請求項 4 4記載の音声符号化装置において、
前記スぺクトル安定化手段は、
前記ノイズ削減 Zスぺクトル補償手段にてノイズ削減とスぺクトル補償を なされたスぺクトルの全域パワーと聴感的に重要な一部の帯域のパワーとを調 ベ、 入力された信号が無音区間かどうかを識別し、 無音区間と判断した場合に は、 全域パヮ一と中域パヮ一に対して安定化処理とパヮ一低減処理とを行なう ことを特徴とする音声符号化装置。
4 8 . 請求項 4 4記載の音声符号化装置において、
前記スぺクトル安定化手段は、
前記フーリエ変換手段で得られた複素スぺクトルに対して、 前記ノイズ削 減 スぺクトル補償手段でスぺクトル補償を受けたかどうかの情報を基に、 乱 数による位相回転を行なう、 ことを特徴とする音声符号化装置。
4 9 . 請求項 4 4記載の音声符号化装置において、
前記スぺクトル強調手段は、
予めスぺクトル強調に用いる重み係数のセットを複数用意し、 ノイズ削減 時には、 入力された信号の状態に応じて重み付け係数のセットを選択し、 選択 された重み付け係数を用いてスぺクトル強調を行なう、 ことを特徴とする音声 符号化装置。
5 0 . 複数個の固定波形を格納する固定波形格納手段と、 前記固定波形格納 手段から読み出された前記複数の固定波形を固定波形毎に任意の始端位置に合 せて配置する固定波形配置手段と、 前記固定波形配置手段で配置された各固定 波形を加算して音源べクトルを生成する加算手段と、 を有する音源べクトル生 成装置と、 前記加算手段から出力される音源べクトルを合成して合成音を生成 する合成フィルタと、 前記固定波形配置手段に対して始端位置の組合せを指示 する一方、 各始端位置の組合せに対応して生成された合成音の歪みを評価する ことで評価値が最大になる始端位置の組合わせを特定する手段と、 入力音声信 号からノィズ成分を除去するノィズ削減装置と、 を具備する音声符号化装置。
5 1 . 請求項 5 0記載の音声符号化装置において、
前記ノイズ削減装置は、
前記入力音声信号をディジ夕ル信号に変換する AZD変換手段と、 ノイズ 削減量を決定するノィズ削減係数を調節するノィズ削減係数調節手段と、 前記 A/D変換手段により得られる一定時間長のディジタル信号に対して線形予測 分析を行う L P C分析手段と、 前記 AZD変換手段により得られる一定時間長 のディジタル信号に対して離散フーリェ変換を行い入カスペクトルと複素スぺ クトルを得るフーリエ変換手段と、 推定されたノイズのスぺクトルを格納する ノイズスぺクトル格納手段と、 前記フーリエ変換手段により得られる入カスペ クトルと前記ノイズスぺクトル格納手段に格納されているノイズスぺクトルと を比較することによってノイズのスぺクトルを推定し、 得られたノイズスぺク トルを前記ノイズスぺクトル格納手段に格納するノイズ推定手段と、 前記ノィ ズ削減係数調節手段により得られる係数に基づいて前記ノイズスぺクトル格納 手段に格納されているノイズスぺクトルを前記フーリエ変換手段により得られ る入力スペクトルから減じ、 更に、 得られるスペクトルを調べ、 減じすぎた周 波数のスぺクトルを補償するノイズ削減 Zスぺクトル補償手段と、 前記ノイズ 削減 スぺクトル補償手段により得られたスぺクトルを安定化処理するととも に、 前記フーリエ変換手段により得られた複素スぺクトルの位相のうち前記ノ ィズ削減 Zスぺクトル補償手段において補償された周波数の位相を調整するス ぺクトル安定化手段と、 前記スぺクトル安定化手段において安定化処理された スぺクトルと調整された位相スぺクトルとに基づいて逆フーリエ変換を行う逆 フーリエ変換手段と、 前記逆フーリエ変換手段により得られた信号に対してス ぺクトル強調を行うスぺクトル強調手段と、 前記スぺクトル強調手段により得 られた信号を前のフレームの信号と整合させる波形整合手段と、 を具備する音 声符号化装置。
5 2 . 請求項 5 1記載の音声符号化装置において、
前記ノイズ推定手段は、
予めノイズ区間であるかどうかの判定を行なう手段と、 ノイズであると判 定した場合には前記フーリェ変換手段により得られる入カスペクトルを各周波 数毎に補償用ノイズスぺクトルと大小比較する手段と、 補償用ノイズスぺクト ルより小さい場合にその周波数の補償用ノイズスぺクトルを入カスペクトルと することによって補償用ノイズスぺクトルを推定する手段と、 補償用ノイズス ぺクトルより小さい場合にその周波数の補償用ノイズスぺクトルを入カスペク トルとして該入カスペクトルを一定割合で加算していくことによって平均ノィ ズスぺクトルを推定する手段と、 前記補償用ノイズスぺクトルと前記平均ノィ ズスぺクトルとをノイズスぺクトル格納手段に格納する手段と、 を具備する音 声符号化装置。
5 3 . 請求項 5 1記載の音声符号化装置において、
前記ノイズ削減ノスぺクトル補償手段は、
前記ノィズ削減係数調節手段にて得られたノィズ削減係数を前記ノィズス ぺクトル格納手段に格納された平均ノイズスぺクトルに乗じて、 前記フーリエ 変換手段にて得られた入カスペクトルから減じ、 負のスぺクトル値になってし まった周波数に対しては前記ノイズスぺクトル格納手段に格納された補償用ノ ィズスぺクトルにより補償する、 ことを特徴とする音声符号化装置。
5 4 . 請求項 5 1記載の音声符号化装置において、
前記スぺクトル安定化手段は、
前記ノイズ削減 スぺクトル補償手段にてノイズ削減とスぺクトル補償を なされたスぺクトルの全域パワーと聴感的に重要な一部の帯域のパワーとを調 ベ、 入力された信号が無音区間かどうかを識別し、 無音区間と判断した場合に は、 全域パヮ一と中域パワーに対して安定化処理とパヮ一低減処理とを行なう ことを特徴とする音声符号化装置。
5 5 . 請求項 5 1記載の音声符号化装置において、
前記スぺクトル安定化手段は、
前記フーリエ変換手段で得られた複素スぺクトルに対して、 前記ノイズ削 減 スぺクトル補償手段でスぺクトル補償を受けたかどうかの情報を基に、 乱 数による位相回転を行なう、 ことを特徴とする音声符号化装置。
5 6 . 請求項 5 1記載の音声符号化装置において、
前記スぺクトル強調手段は、
予めスぺクトル強調に用いる重み係数のセットを複数用意し、 ノイズ削減 時には、 入力された信号の状態に応じて重み付け係数のセットを選択し、 選択 された重み付け係数を用いてスぺクトル強調を行なう、 ことを特徴とする音声 符号化装置。
5 7 . 複数個のシードを格納するシード格納手段と、 シードの値に応じて異 なるべクトル系列を出力する発振器と、 前記発振器から出力されるべクトル系 列を音源べクトルとして L P C合成して合成音を生成する合成フィル夕と、 受 信した音声符号に含まれているシード番号に基づいて前記シード格納手段から シ一ドを取出して前記発振器へ供給する手段と、 を具備した音声復号化装置。
5 8 . 請求項 5 7記載の音声複号化装置において、
前記発振器が、 非線形ディジタルフィルタであることを特徴とする音声復号 化装置。
5 9 . 請求項 5 8記載の音声復号化装置において、
前記非線形ディジタルフィルタは、
非線形加算特性を有する加算器と、 前記加算器出力が状態変数として順次 転送される複数の状態変数保持部と、 前記各状態変数保持部から出力された状 態変数に対してゲインを乗じて乗算値を前記加算器へ出力する複数の乗算器と を有し、
前記状態変数保持部は、 前記シ一ド格納手段から読出されたシードが前記 状態変数の初期値として与えられ、
前記加算器は、 外部から供給されるべクトル系列と前記乗算器の出力する 乗算値とを入力値とし、 前記入力値の総和に対して前記非線形加算特性にした がった加算器出力を発生し、
前記乗算器は、 ディジ夕ルフィル夕の極が Z平面における単位円外に存在 するようにゲインが固定されている、 ことを特徴とする音声複号化装置。
6 0 . 過去の音源ベクトルを格納する音源格納手段と、 前記音源ベクトルか ら読み出された 1つ又は複数の過去の音源べクトルに対してインデクスに応じ て異なる加工を加えてランダムな新しい音源べクトルを生成する音源べクトル 加工手段と、 前記音源べクトル加工手段から出力される音源べクトルを L P C 合成して合成音を生成する合成フィル夕と、 受信した音声符号に含まれている インデクスを前記音源べクトル加工手段に与える手段と、 を具備した音声復号 化装置。
6 1 . 請求項 6 0記載の音声複号化装置において、
前記音源べクトル加工手段は、
前記インデクスに応じて過去の音源べクトルに加える処理内容を決定する 手段と、 前記音源格納手段から読み出された過去の音源べクトルに対して決定 した処理内容に応じた処理を順次実行する複数の処理部と、 を具備する音声復 号化装置。
6 2 . 直前の音源情報が適応ベクトルとして格納される適応符号帳と、 ラン ダムな雑音べクトルを発生させる雑音符号帳と、 前記適応べクトルと前記雑音 べクトルをそれぞれ L P C合成する合成フィルタとを備えた C E L P型の音声 復号化装置であり、
前記雑音符号帳は、 複数個のシードを格納するシード格納手段と、 シード の値に応じて異なるべクトル系列を出力する発振器と、 前記シード格納手段か ら前記発振器へ供給するシードを受信された音声符号に含まれているシード番 号に基づいて切替える切替え手段とを具備する音源べクトル生成装置で構成さ れる、 ことを特徴とする C E L P型音声復号化装置。
6 3 . 複数個の固定波形を格納する固定波形格納手段と、 前記固定波形格納 手段から読み出された前記複数の固定波形を固定波形毎に任意の始端位置に合 せて配置する固定波形配置手段と、 前記固定波形配置手段で配置された各固定 波形を加算して音源べクトルを生成する加算手段と、 を有する音源べクトル生 成装置と、 前記加算手段から出力される音源べクトルを合成して合成音を生成 する合成フィル夕と、 受信した音声符号に含まれた始端位置の組み合せを前記 固定波形配置手段に対して指示する手段と、 を具備した音声複号化装置。
6 4 . 直前の音源情報が適応ベクトルとして格納される適応符号帳と、 雑音 べクトルを発生させる雑音符号帳と、 前記適応べクトルと前記雑音べクトルを それぞれ L P C合成する合成フィル夕とを備えた C E L P型の音声復号化装置 であり、
前記雑音符号帳は、 複数個の固定波形を格納する固定波形格納手段と、 前 記固定波形格納手段から読み出された前記複数の固定波形を固定波形毎に任意 の始端位置に合せて配置する固定波形配置手段と、 前記固定波形配置手段で配 置された各固定波形を加算して音源べクトルを生成する加算手段と、 受信した 音声符号に含まれた始端位置の組み合せを前記固定波形配置手段に対して指示 する手段と、 を具備する音源べクトル生成装置で構成されたことを特徴とする C E L P型音声復号化装置。
65. 請求項 64記載の CE LP型音声復号化装置において、
雑音べクトルを発生させる第 2の雑音符号帳と、 受信した音声符号に含まれ たコードに基づいて前記雑音符号帳と前記第 2の雑音符号帳とから一つの雑音 符号帳を選択する選択手段とを、 さらに具備した C E L P型音声復号化装置。
66. 請求項 65記載の CE LP型音声復号化装置において、
前記第 2の雑音符号帳は、 複数のランダム数列を格納したべクトル格納部で あることを特徴とする C E L P型音声復号化装置。
67. 請求項 65記載の CE LP型音声復号化装置において、
前記第 2の雑音符号帳は、 複数のパルス列を格納したパルス列格納部である ことを特徴とする C E L P型音声復号化装置。
68. 請求項 65記載の CE LP型音声復号化装置において、
前記第 2の雑音符号帳は、 前記音源べクトル生成装置と同じ構成を有してお り、 前記固定波形格納手段に格納される固定波形の個数が前記雑音符号帳と異 なることを特徴とする C E L P型音声復号化装置。
PCT/JP1997/004033 1996-11-07 1997-11-06 Generateur de vecteur de source sonore, codeur et decodeur vocal WO1998020483A1 (fr)

Priority Applications (20)

Application Number Priority Date Filing Date Title
EP99126132A EP0991054B1 (en) 1996-11-07 1997-11-06 A CELP Speech Coder or Decoder, and a Method for CELP Speech Coding or Decoding
KR1019980705215A KR100306817B1 (ko) 1996-11-07 1997-11-06 음원벡터생성장치및음원벡터생성방법
CA002242345A CA2242345C (en) 1996-11-07 1997-11-06 Excitation vector generator, speech coder and speech decoder
KR10-2003-7012052A KR20040000406A (ko) 1996-11-07 1997-11-06 변형 벡터 생성 장치
EP97911460A EP0883107B9 (en) 1996-11-07 1997-11-06 Sound source vector generator, voice encoder, and voice decoder
AU48842/97A AU4884297A (en) 1996-11-07 1997-11-06 Sound source vector generator, voice encoder, and voice decoder
US09/101,186 US6453288B1 (en) 1996-11-07 1997-11-06 Method and apparatus for producing component of excitation vector
DE69730316T DE69730316T2 (de) 1996-11-07 1997-11-06 Schallquellengenerator, sprachkodierer und sprachdekodierer
HK99102382A HK1017472A1 (en) 1996-11-07 1999-05-27 Sound source vector generator and method for generating a sound source vector.
US09/440,083 US6421639B1 (en) 1996-11-07 1999-11-15 Apparatus and method for providing an excitation vector
US09/843,939 US6947889B2 (en) 1996-11-07 2001-04-30 Excitation vector generator and a method for generating an excitation vector including a convolution system
US09/849,398 US7289952B2 (en) 1996-11-07 2001-05-07 Excitation vector generator, speech coder and speech decoder
US11/126,171 US7587316B2 (en) 1996-11-07 2005-05-11 Noise canceller
US11/421,932 US7398205B2 (en) 1996-11-07 2006-06-02 Code excited linear prediction speech decoder and method thereof
US11/508,852 US20070100613A1 (en) 1996-11-07 2006-08-24 Excitation vector generator, speech coder and speech decoder
US12/134,256 US7809557B2 (en) 1996-11-07 2008-06-06 Vector quantization apparatus and method for updating decoded vector storage
US12/198,734 US20090012781A1 (en) 1996-11-07 2008-08-26 Speech coder and speech decoder
US12/781,049 US8036887B2 (en) 1996-11-07 2010-05-17 CELP speech decoder modifying an input vector with a fixed waveform to transform a waveform of the input vector
US12/870,122 US8086450B2 (en) 1996-11-07 2010-08-27 Excitation vector generator, speech coder and speech decoder
US13/302,677 US8370137B2 (en) 1996-11-07 2011-11-22 Noise estimating apparatus and method

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
JP8/294738 1996-11-07
JP29473896A JP4003240B2 (ja) 1996-11-07 1996-11-07 音声符号化装置及び音声復号化装置
JP31032496A JP4006770B2 (ja) 1996-11-21 1996-11-21 ノイズ推定装置、ノイズ削減装置、ノイズ推定方法、及びノイズ削減方法
JP8/310324 1996-11-21
JP03458397A JP3700310B2 (ja) 1997-02-19 1997-02-19 ベクトル量子化装置及びベクトル量子化方法
JP9/34583 1997-02-19
JP9/34582 1997-02-19
JP03458297A JP3174742B2 (ja) 1997-02-19 1997-02-19 Celp型音声復号化装置及びcelp型音声復号化方法

Related Child Applications (8)

Application Number Title Priority Date Filing Date
US09101186 A-371-Of-International 1997-11-06
US09101189 A-371-Of-International 1997-11-06
US09/101,186 A-371-Of-International US6453288B1 (en) 1996-11-07 1997-11-06 Method and apparatus for producing component of excitation vector
US09/440,087 Division US6330534B1 (en) 1996-11-07 1999-11-15 Excitation vector generator, speech coder and speech decoder
US09/440,092 Division US6330535B1 (en) 1996-11-07 1999-11-15 Method for providing excitation vector
US09/843,938 Division US6772115B2 (en) 1996-11-07 2001-04-30 LSP quantizer
US09/849,398 Division US7289952B2 (en) 1996-11-07 2001-05-07 Excitation vector generator, speech coder and speech decoder
US09/855,708 Division US6757650B2 (en) 1996-11-07 2001-05-16 Excitation vector generator, speech coder and speech decoder

Publications (1)

Publication Number Publication Date
WO1998020483A1 true WO1998020483A1 (fr) 1998-05-14

Family

ID=27459954

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1997/004033 WO1998020483A1 (fr) 1996-11-07 1997-11-06 Generateur de vecteur de source sonore, codeur et decodeur vocal

Country Status (9)

Country Link
US (20) US6453288B1 (ja)
EP (16) EP1071078B1 (ja)
KR (9) KR100326777B1 (ja)
CN (11) CN1167047C (ja)
AU (1) AU4884297A (ja)
CA (1) CA2242345C (ja)
DE (17) DE69721595T2 (ja)
HK (2) HK1017472A1 (ja)
WO (1) WO1998020483A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1041541A1 (en) * 1998-10-27 2000-10-04 Matsushita Electric Industrial Co., Ltd. Celp voice encoder
KR100886062B1 (ko) * 1997-10-22 2009-02-26 파나소닉 주식회사 확산 펄스 벡터 생성 장치 및 방법
US8090119B2 (en) 2007-04-06 2012-01-03 Yamaha Corporation Noise suppressing apparatus and program
WO2014083999A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
WO2014084000A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム

Families Citing this family (136)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5995539A (en) * 1993-03-17 1999-11-30 Miller; William J. Method and apparatus for signal transmission and reception
DE69721595T2 (de) * 1996-11-07 2003-11-27 Matsushita Electric Ind Co Ltd Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
EP2154679B1 (en) 1997-12-24 2016-09-14 BlackBerry Limited Method and apparatus for speech coding
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6687663B1 (en) * 1999-06-25 2004-02-03 Lake Technology Limited Audio processing method and apparatus
FI116992B (fi) * 1999-07-05 2006-04-28 Nokia Corp Menetelmät, järjestelmä ja laitteet audiosignaalin koodauksen ja siirron tehostamiseksi
JP3784583B2 (ja) * 1999-08-13 2006-06-14 沖電気工業株式会社 音声蓄積装置
KR100391527B1 (ko) 1999-08-23 2003-07-12 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치, 기록 매체, 음성 복호화 장치, 신호 처리용 프로세서, 음성 부호화 복호화 시스템, 통신용 기지국, 통신용 단말 및 무선 통신 시스템
JP2001075600A (ja) * 1999-09-07 2001-03-23 Mitsubishi Electric Corp 音声符号化装置および音声復号化装置
JP3417362B2 (ja) * 1999-09-10 2003-06-16 日本電気株式会社 音声信号復号方法及び音声信号符号化復号方法
WO2001020595A1 (en) * 1999-09-14 2001-03-22 Fujitsu Limited Voice encoder/decoder
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
JP3594854B2 (ja) 1999-11-08 2004-12-02 三菱電機株式会社 音声符号化装置及び音声復号化装置
USRE43209E1 (en) 1999-11-08 2012-02-21 Mitsubishi Denki Kabushiki Kaisha Speech coding apparatus and speech decoding apparatus
AU2547201A (en) * 2000-01-11 2001-07-24 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
EP1796083B1 (en) * 2000-04-24 2009-01-07 Qualcomm Incorporated Method and apparatus for predictively quantizing voiced speech
JP3426207B2 (ja) * 2000-10-26 2003-07-14 三菱電機株式会社 音声符号化方法および装置
JP3404024B2 (ja) * 2001-02-27 2003-05-06 三菱電機株式会社 音声符号化方法および音声符号化装置
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
JP3888097B2 (ja) * 2001-08-02 2007-02-28 松下電器産業株式会社 ピッチ周期探索範囲設定装置、ピッチ周期探索装置、復号化適応音源ベクトル生成装置、音声符号化装置、音声復号化装置、音声信号送信装置、音声信号受信装置、移動局装置、及び基地局装置
US7110942B2 (en) * 2001-08-14 2006-09-19 Broadcom Corporation Efficient excitation quantization in a noise feedback coding system using correlation techniques
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
WO2003071522A1 (fr) * 2002-02-20 2003-08-28 Matsushita Electric Industrial Co., Ltd. Procede de production de vecteur de source sonore fixe et table de codage de source sonore fixe
US7694326B2 (en) * 2002-05-17 2010-04-06 Sony Corporation Signal processing system and method, signal processing apparatus and method, recording medium, and program
JP4304360B2 (ja) * 2002-05-22 2009-07-29 日本電気株式会社 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
US7103538B1 (en) * 2002-06-10 2006-09-05 Mindspeed Technologies, Inc. Fixed code book with embedded adaptive code book
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
JP2004101588A (ja) * 2002-09-05 2004-04-02 Hitachi Kokusai Electric Inc 音声符号化方法及び音声符号化装置
AU2002952079A0 (en) * 2002-10-16 2002-10-31 Darrell Ballantyne Copeman Winch
JP3887598B2 (ja) * 2002-11-14 2007-02-28 松下電器産業株式会社 確率的符号帳の音源の符号化方法及び復号化方法
KR100480341B1 (ko) * 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
US7249014B2 (en) * 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US7742926B2 (en) 2003-04-18 2010-06-22 Realnetworks, Inc. Digital audio signal compression method and apparatus
US20040208169A1 (en) * 2003-04-18 2004-10-21 Reznik Yuriy A. Digital audio signal compression method and apparatus
US7370082B2 (en) * 2003-05-09 2008-05-06 Microsoft Corporation Remote invalidation of pre-shared RDMA key
KR100546758B1 (ko) * 2003-06-30 2006-01-26 한국전자통신연구원 음성의 상호부호화시 전송률 결정 장치 및 방법
US7146309B1 (en) 2003-09-02 2006-12-05 Mindspeed Technologies, Inc. Deriving seed values to generate excitation values in a speech coder
JP2007536817A (ja) * 2004-05-04 2007-12-13 クゥアルコム・インコーポレイテッド 動作補償されたフレームレートアップコンバージョンのための方法および装置
JP4445328B2 (ja) 2004-05-24 2010-04-07 パナソニック株式会社 音声・楽音復号化装置および音声・楽音復号化方法
JP3827317B2 (ja) * 2004-06-03 2006-09-27 任天堂株式会社 コマンド処理装置
WO2006007527A2 (en) * 2004-07-01 2006-01-19 Qualcomm Incorporated Method and apparatus for using frame rate up conversion techniques in scalable video coding
KR100672355B1 (ko) * 2004-07-16 2007-01-24 엘지전자 주식회사 음성 코딩/디코딩 방법 및 그를 위한 장치
AU2005267171A1 (en) 2004-07-20 2006-02-02 Qualcomm Incorporated Method and apparatus for encoder assisted-frame rate up conversion (EA-FRUC) for video compression
US8553776B2 (en) * 2004-07-21 2013-10-08 QUALCOMM Inorporated Method and apparatus for motion vector assignment
CN101006495A (zh) * 2004-08-31 2007-07-25 松下电器产业株式会社 语音编码装置、语音解码装置、通信装置以及语音编码方法
KR20070084002A (ko) * 2004-11-05 2007-08-24 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 복호화 장치 및 스케일러블 부호화 장치
JP4903053B2 (ja) * 2004-12-10 2012-03-21 パナソニック株式会社 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
KR100707173B1 (ko) * 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
US20060215683A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for voice quality enhancement
US20060217988A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for adaptive level control
US20060217970A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for noise reduction
US20060217972A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal
US20060217983A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for injecting comfort noise in a communications system
US20090319277A1 (en) * 2005-03-30 2009-12-24 Nokia Corporation Source Coding and/or Decoding
RU2376657C2 (ru) 2005-04-01 2009-12-20 Квэлкомм Инкорпорейтед Системы, способы и устройства для высокополосного предыскажения шкалы времени
TWI317933B (en) 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
JP4954069B2 (ja) * 2005-06-17 2012-06-13 パナソニック株式会社 ポストフィルタ、復号化装置及びポストフィルタ処理方法
EP1898397B1 (en) * 2005-06-29 2009-10-21 Panasonic Corporation Scalable decoder and disappeared data interpolating method
EP1906706B1 (en) * 2005-07-15 2009-11-25 Panasonic Corporation Audio decoder
WO2007025061A2 (en) * 2005-08-25 2007-03-01 Bae Systems Information And Electronics Systems Integration Inc. Coherent multichip rfid tag and method and appartus for creating such coherence
JP5159318B2 (ja) * 2005-12-09 2013-03-06 パナソニック株式会社 固定符号帳探索装置および固定符号帳探索方法
US8135584B2 (en) 2006-01-31 2012-03-13 Siemens Enterprise Communications Gmbh & Co. Kg Method and arrangements for coding audio signals
CN101336451B (zh) * 2006-01-31 2012-09-05 西门子企业通讯有限责任两合公司 音频信号编码的方法和装置
US7958164B2 (en) * 2006-02-16 2011-06-07 Microsoft Corporation Visual design of annotated regular expression
US20070230564A1 (en) * 2006-03-29 2007-10-04 Qualcomm Incorporated Video processing with scalability
WO2007114290A1 (ja) * 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
US8750387B2 (en) * 2006-04-04 2014-06-10 Qualcomm Incorporated Adaptive encoder-assisted frame rate up conversion
US8634463B2 (en) * 2006-04-04 2014-01-21 Qualcomm Incorporated Apparatus and method of enhanced frame interpolation in video compression
US20090164211A1 (en) * 2006-05-10 2009-06-25 Panasonic Corporation Speech encoding apparatus and speech encoding method
US20090198491A1 (en) * 2006-05-12 2009-08-06 Panasonic Corporation Lsp vector quantization apparatus, lsp vector inverse-quantization apparatus, and their methods
US20090240494A1 (en) * 2006-06-29 2009-09-24 Panasonic Corporation Voice encoding device and voice encoding method
US8335684B2 (en) 2006-07-12 2012-12-18 Broadcom Corporation Interchangeable noise feedback coding and code excited linear prediction encoders
EP2051244A4 (en) * 2006-08-08 2010-04-14 Panasonic Corp AUDIOCODING DEVICE AND AUDIOCODING METHOD
EP2063418A4 (en) * 2006-09-15 2010-12-15 Panasonic Corp AUDIO CODING DEVICE AND AUDIO CODING METHOD
JPWO2008047795A1 (ja) * 2006-10-17 2010-02-25 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
JP5231243B2 (ja) 2006-11-28 2013-07-10 パナソニック株式会社 符号化装置及び符号化方法
EP2091257B1 (en) * 2006-11-30 2017-12-27 Panasonic Corporation Coder
EP2101318B1 (en) * 2006-12-13 2014-06-04 Panasonic Corporation Encoding device, decoding device and corresponding methods
WO2008072732A1 (ja) * 2006-12-14 2008-06-19 Panasonic Corporation 音声符号化装置および音声符号化方法
EP2101319B1 (en) * 2006-12-15 2015-09-16 Panasonic Intellectual Property Corporation of America Adaptive sound source vector quantization device and method thereof
WO2008072736A1 (ja) * 2006-12-15 2008-06-19 Panasonic Corporation 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法
US8036886B2 (en) * 2006-12-22 2011-10-11 Digital Voice Systems, Inc. Estimation of pulsed speech model parameters
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
GB0703275D0 (en) * 2007-02-20 2007-03-28 Skype Ltd Method of estimating noise levels in a communication system
EP2128855A1 (en) * 2007-03-02 2009-12-02 Panasonic Corporation Voice encoding device and voice encoding method
US8489396B2 (en) * 2007-07-25 2013-07-16 Qnx Software Systems Limited Noise reduction with integrated tonal noise reduction
US20100207689A1 (en) * 2007-09-19 2010-08-19 Nec Corporation Noise suppression device, its method, and program
BRPI0818062A2 (pt) * 2007-10-12 2015-03-31 Panasonic Corp Quantizador vetorial, quantizador vetorial inverso, e métodos
US7937623B2 (en) * 2007-10-19 2011-05-03 Oracle International Corporation Diagnosability system
WO2009081568A1 (ja) * 2007-12-21 2009-07-02 Panasonic Corporation 符号化装置、復号装置および符号化方法
US8306817B2 (en) * 2008-01-08 2012-11-06 Microsoft Corporation Speech recognition with non-linear noise reduction on Mel-frequency cepstra
CN101911185B (zh) * 2008-01-16 2013-04-03 松下电器产业株式会社 矢量量化装置、矢量反量化装置及其方法
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
KR101616873B1 (ko) * 2008-12-23 2016-05-02 삼성전자주식회사 디지털 앰프의 소요 전력량 예측 장치 및 그 방법
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
US20100174539A1 (en) * 2009-01-06 2010-07-08 Qualcomm Incorporated Method and apparatus for vector quantization codebook search
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) * 2009-01-06 2013-11-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
EP2555191A1 (en) 2009-03-31 2013-02-06 Huawei Technologies Co., Ltd. Method and device for audio signal denoising
CN101538923B (zh) * 2009-04-07 2011-05-11 上海翔实玻璃有限公司 新型墙体装饰安装结构
JP2010249939A (ja) * 2009-04-13 2010-11-04 Sony Corp ノイズ低減装置、ノイズ判定方法
EP2246845A1 (en) * 2009-04-21 2010-11-03 Siemens Medical Instruments Pte. Ltd. Method and acoustic signal processing device for estimating linear predictive coding coefficients
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
WO2011052221A1 (ja) * 2009-10-30 2011-05-05 パナソニック株式会社 符号化装置、復号装置、およびそれらの方法
EP2515299B1 (en) * 2009-12-14 2018-06-20 Fraunhofer Gesellschaft zur Förderung der Angewand Vector quantization device, voice coding device, vector quantization method, and voice coding method
US9236063B2 (en) * 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US8599820B2 (en) * 2010-09-21 2013-12-03 Anite Finland Oy Apparatus and method for communication
US9972325B2 (en) * 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
ES2960582T3 (es) * 2012-03-29 2024-03-05 Ericsson Telefon Ab L M Cuantificador vectorial
RU2495504C1 (ru) * 2012-06-25 2013-10-10 Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ снижения скорости передачи низкоскоростных вокодеров с линейным предсказанием
PT2904612T (pt) * 2012-10-05 2018-12-17 Fraunhofer Ges Forschung Um aparelho para codificar um sinal de discurso que emprega acelp no domínio de autocorrelação
WO2015008783A1 (ja) * 2013-07-18 2015-01-22 日本電信電話株式会社 線形予測分析装置、方法、プログラム及び記録媒体
CN103714820B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 参数域的丢包隐藏方法及装置
US20190332619A1 (en) * 2014-08-07 2019-10-31 Cortical.Io Ag Methods and systems for mapping data items to sparse distributed representations
US10394851B2 (en) 2014-08-07 2019-08-27 Cortical.Io Ag Methods and systems for mapping data items to sparse distributed representations
US10885089B2 (en) * 2015-08-21 2021-01-05 Cortical.Io Ag Methods and systems for identifying a level of similarity between a filtering criterion and a data item within a set of streamed documents
US9953660B2 (en) * 2014-08-19 2018-04-24 Nuance Communications, Inc. System and method for reducing tandeming effects in a communication system
US9582425B2 (en) 2015-02-18 2017-02-28 International Business Machines Corporation Set selection of a set-associative storage container
CN104966517B (zh) * 2015-06-02 2019-02-01 华为技术有限公司 一种音频信号增强方法和装置
US20160372127A1 (en) * 2015-06-22 2016-12-22 Qualcomm Incorporated Random noise seed value generation
RU2631968C2 (ru) * 2015-07-08 2017-09-29 Федеральное государственное казенное военное образовательное учреждение высшего образования "Академия Федеральной службы охраны Российской Федерации" (Академия ФСО России) Способ низкоскоростного кодирования и декодирования речевого сигнала
US10044547B2 (en) * 2015-10-30 2018-08-07 Taiwan Semiconductor Manufacturing Company, Ltd. Digital code recovery with preamble
CN105976822B (zh) * 2016-07-12 2019-12-03 西北工业大学 基于参数化超增益波束形成器的音频信号提取方法及装置
US10572221B2 (en) 2016-10-20 2020-02-25 Cortical.Io Ag Methods and systems for identifying a level of similarity between a plurality of data representations
CN106788433B (zh) * 2016-12-13 2019-07-05 山东大学 数字噪声源、数据处理系统及数据处理方法
US10854108B2 (en) 2017-04-17 2020-12-01 Facebook, Inc. Machine communication system using haptic symbol set
CN110739002B (zh) * 2019-10-16 2022-02-22 中山大学 基于生成对抗网络的复数域语音增强方法、系统及介质
CN110751960B (zh) * 2019-10-16 2022-04-26 北京网众共创科技有限公司 噪声数据的确定方法及装置
US11270714B2 (en) 2020-01-08 2022-03-08 Digital Voice Systems, Inc. Speech coding using time-varying interpolation
US11734332B2 (en) 2020-11-19 2023-08-22 Cortical.Io Ag Methods and systems for reuse of data item fingerprints in generation of semantic maps

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0212300A (ja) * 1988-06-30 1990-01-17 Nec Corp マルチパルス符号化装置
JPH06175695A (ja) * 1992-12-01 1994-06-24 Nippon Telegr & Teleph Corp <Ntt> 音声パラメータの符号化方法および復号方法
JPH06202697A (ja) * 1993-01-07 1994-07-22 Nippon Telegr & Teleph Corp <Ntt> 励振信号の利得量子化方法
JPH07295598A (ja) * 1994-04-21 1995-11-10 Nec Corp ベクトル量子化装置
JPH086600A (ja) * 1994-06-23 1996-01-12 Toshiba Corp 音声符号化装置及び音声復号化装置
JPH0816196A (ja) * 1994-07-04 1996-01-19 Fujitsu Ltd 音声符号復号化装置
JPH0844400A (ja) * 1994-05-27 1996-02-16 Toshiba Corp ベクトル量子化装置
JPH08279757A (ja) * 1995-04-06 1996-10-22 Casio Comput Co Ltd 階層式ベクトル量子化装置

Family Cites Families (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US488751A (en) * 1892-12-27 Device for moistening envelopes
US4797925A (en) 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
JPH0738118B2 (ja) * 1987-02-04 1995-04-26 日本電気株式会社 マルチパルス符号化装置
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
JP2859634B2 (ja) 1989-04-19 1999-02-17 株式会社リコー 雑音除去装置
US5212764A (en) * 1989-04-19 1993-05-18 Ricoh Company, Ltd. Noise eliminating apparatus and speech recognition apparatus using the same
WO1990013112A1 (en) * 1989-04-25 1990-11-01 Kabushiki Kaisha Toshiba Voice encoder
US5060269A (en) 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
US4963034A (en) * 1989-06-01 1990-10-16 Simon Fraser University Low-delay vector backward predictive coding of speech
US5204906A (en) 1990-02-13 1993-04-20 Matsushita Electric Industrial Co., Ltd. Voice signal processing device
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5701392A (en) 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
KR950013552B1 (ko) * 1990-05-28 1995-11-08 마쯔시다덴기산교 가부시기가이샤 음성신호처리장치
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
JP3077944B2 (ja) 1990-11-28 2000-08-21 シャープ株式会社 信号再生装置
JP2836271B2 (ja) 1991-01-30 1998-12-14 日本電気株式会社 雑音除去装置
JPH04264597A (ja) * 1991-02-20 1992-09-21 Fujitsu Ltd 音声符号化装置および音声復号装置
FI98104C (fi) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5187745A (en) * 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US5390278A (en) * 1991-10-08 1995-02-14 Bell Canada Phoneme based speech recognition
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
JPH0643892A (ja) 1992-02-18 1994-02-18 Matsushita Electric Ind Co Ltd 音声認識方法
JPH0612098A (ja) * 1992-03-16 1994-01-21 Sanyo Electric Co Ltd 音声符号化装置
JP3276977B2 (ja) * 1992-04-02 2002-04-22 シャープ株式会社 音声符号化装置
US5251263A (en) * 1992-05-22 1993-10-05 Andrea Electronics Corporation Adaptive noise cancellation and speech enhancement system and apparatus therefor
US5307405A (en) * 1992-09-25 1994-04-26 Qualcomm Incorporated Network echo canceller
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
CN2150614Y (zh) 1993-03-17 1993-12-22 张宝源 磁盘退磁与磁性强度调整控制器
US5428561A (en) 1993-04-22 1995-06-27 Zilog, Inc. Efficient pseudorandom value generator
SG43128A1 (en) * 1993-06-10 1997-10-17 Oki Electric Ind Co Ltd Code excitation linear predictive (celp) encoder and decoder
GB2281680B (en) * 1993-08-27 1998-08-26 Motorola Inc A voice activity detector for an echo suppressor and an echo suppressor
JP2675981B2 (ja) * 1993-09-20 1997-11-12 インターナショナル・ビジネス・マシーンズ・コーポレイション スヌープ・プッシュ・オペレーションを回避する方法
US5450449A (en) * 1994-03-14 1995-09-12 At&T Ipm Corp. Linear prediction coefficient generation during frame erasure or packet loss
US6463406B1 (en) * 1994-03-25 2002-10-08 Texas Instruments Incorporated Fractional pitch method
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
JP3001375B2 (ja) 1994-06-15 2000-01-24 株式会社立松製作所 ドアヒンジ装置
JP3360423B2 (ja) 1994-06-21 2002-12-24 三菱電機株式会社 音声強調装置
IT1266943B1 (it) 1994-09-29 1997-01-21 Cselt Centro Studi Lab Telecom Procedimento di sintesi vocale mediante concatenazione e parziale sovrapposizione di forme d'onda.
US5550543A (en) * 1994-10-14 1996-08-27 Lucent Technologies Inc. Frame erasure or packet loss compensation method
JP3328080B2 (ja) 1994-11-22 2002-09-24 沖電気工業株式会社 コード励振線形予測復号器
JPH08160994A (ja) 1994-12-07 1996-06-21 Matsushita Electric Ind Co Ltd 雑音抑圧装置
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
US5751903A (en) * 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
JP3285185B2 (ja) 1995-06-16 2002-05-27 日本電信電話株式会社 音響信号符号化方法
US5561668A (en) * 1995-07-06 1996-10-01 Coherent Communications Systems Corp. Echo canceler with subband attenuation and noise injection control
US5949888A (en) * 1995-09-15 1999-09-07 Hughes Electronics Corporaton Comfort noise generator for echo cancelers
JP3196595B2 (ja) * 1995-09-27 2001-08-06 日本電気株式会社 音声符号化装置
JP3137176B2 (ja) * 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
EP0875107B1 (de) * 1996-03-07 1999-09-01 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Codierverfahren zur einbringung eines nicht hörbaren datensignals in ein audiosignal, decodierverfahren, codierer und decodierer
JPH09281995A (ja) * 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
JP3094908B2 (ja) * 1996-04-17 2000-10-03 日本電気株式会社 音声符号化装置
JP3335841B2 (ja) * 1996-05-27 2002-10-21 日本電気株式会社 信号符号化装置
US5742694A (en) * 1996-07-12 1998-04-21 Eatwell; Graham P. Noise reduction filter
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
US5963899A (en) * 1996-08-07 1999-10-05 U S West, Inc. Method and system for region based filtering of speech
JP3174733B2 (ja) 1996-08-22 2001-06-11 松下電器産業株式会社 Celp型音声復号化装置、およびcelp型音声復号化方法
CA2213909C (en) * 1996-08-26 2002-01-22 Nec Corporation High quality speech coder at low bit rates
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
DE69721595T2 (de) * 1996-11-07 2003-11-27 Matsushita Electric Ind Co Ltd Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
CA2242610C (en) 1996-11-11 2003-01-28 Matsushita Electric Industrial Co., Ltd. Sound reproducing speed converter
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
US6148282A (en) * 1997-01-02 2000-11-14 Texas Instruments Incorporated Multimodal code-excited linear prediction (CELP) coder and method using peakiness measure
US5940429A (en) * 1997-02-25 1999-08-17 Solana Technology Development Corporation Cross-term compensation power adjustment of embedded auxiliary data in a primary data signal
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法
US5903866A (en) * 1997-03-10 1999-05-11 Lucent Technologies Inc. Waveform interpolation speech coding using splines
US5970444A (en) * 1997-03-13 1999-10-19 Nippon Telegraph And Telephone Corporation Speech coding method
JPH10260692A (ja) * 1997-03-18 1998-09-29 Toshiba Corp 音声の認識合成符号化/復号化方法及び音声符号化/復号化システム
JPH10318421A (ja) * 1997-05-23 1998-12-04 Sumitomo Electric Ind Ltd 比例圧力制御弁
CN1129568C (zh) * 1997-06-13 2003-12-03 宝酒造株式会社 羟基环戊酮
US6073092A (en) * 1997-06-26 2000-06-06 Telogy Networks, Inc. Method for speech coding based on a code excited linear prediction (CELP) model
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6029125A (en) 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6058359A (en) 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
JP3922482B2 (ja) * 1997-10-14 2007-05-30 ソニー株式会社 情報処理装置および方法
EP0967594B1 (en) * 1997-10-22 2006-12-13 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
US6163608A (en) * 1998-01-09 2000-12-19 Ericsson Inc. Methods and apparatus for providing comfort noise in communications systems
US6023674A (en) * 1998-01-23 2000-02-08 Telefonaktiebolaget L M Ericsson Non-parametric voice activity detection
US6301556B1 (en) 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
US6415252B1 (en) * 1998-05-28 2002-07-02 Motorola, Inc. Method and apparatus for coding and decoding speech
JP3180786B2 (ja) * 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
JP4245300B2 (ja) 2002-04-02 2009-03-25 旭化成ケミカルズ株式会社 生分解性ポリエステル延伸成形体の製造方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0212300A (ja) * 1988-06-30 1990-01-17 Nec Corp マルチパルス符号化装置
JPH06175695A (ja) * 1992-12-01 1994-06-24 Nippon Telegr & Teleph Corp <Ntt> 音声パラメータの符号化方法および復号方法
JPH06202697A (ja) * 1993-01-07 1994-07-22 Nippon Telegr & Teleph Corp <Ntt> 励振信号の利得量子化方法
JPH07295598A (ja) * 1994-04-21 1995-11-10 Nec Corp ベクトル量子化装置
JPH0844400A (ja) * 1994-05-27 1996-02-16 Toshiba Corp ベクトル量子化装置
JPH086600A (ja) * 1994-06-23 1996-01-12 Toshiba Corp 音声符号化装置及び音声復号化装置
JPH0816196A (ja) * 1994-07-04 1996-01-19 Fujitsu Ltd 音声符号復号化装置
JPH08279757A (ja) * 1995-04-06 1996-10-22 Casio Comput Co Ltd 階層式ベクトル量子化装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP0883107A4 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100886062B1 (ko) * 1997-10-22 2009-02-26 파나소닉 주식회사 확산 펄스 벡터 생성 장치 및 방법
EP1041541A1 (en) * 1998-10-27 2000-10-04 Matsushita Electric Industrial Co., Ltd. Celp voice encoder
EP1041541A4 (en) * 1998-10-27 2005-07-20 Matsushita Electric Ind Co Ltd PLEC VOICE CODE
US8090119B2 (en) 2007-04-06 2012-01-03 Yamaha Corporation Noise suppressing apparatus and program
WO2014083999A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム
WO2014084000A1 (ja) * 2012-11-27 2014-06-05 日本電気株式会社 信号処理装置、信号処理方法、および信号処理プログラム

Also Published As

Publication number Publication date
DE69712538D1 (de) 2002-06-13
US6345247B1 (en) 2002-02-05
CN1338725A (zh) 2002-03-06
DE69711715T2 (de) 2002-07-18
DE69712539T2 (de) 2002-08-29
EP1071079B1 (en) 2002-06-26
DE69730316D1 (de) 2004-09-23
US8036887B2 (en) 2011-10-11
DE69710794D1 (de) 2002-04-04
DE69715478T2 (de) 2003-01-09
US20090012781A1 (en) 2009-01-08
DE69708693C5 (de) 2021-10-28
DE69712537D1 (de) 2002-06-13
EP1136985A3 (en) 2001-10-10
DE69710505D1 (de) 2002-03-21
EP1071081A3 (en) 2001-01-31
DE69712535T2 (de) 2002-08-29
CN1503223A (zh) 2004-06-09
EP1094447A2 (en) 2001-04-25
DE69713633T2 (de) 2002-10-31
EP1074978B1 (en) 2002-02-27
CN1170267C (zh) 2004-10-06
DE69708697T2 (de) 2002-08-01
CN1677489A (zh) 2005-10-05
EP0883107A1 (en) 1998-12-09
EP1071078B1 (en) 2002-02-13
US20010029448A1 (en) 2001-10-11
US8370137B2 (en) 2013-02-05
US6799160B2 (en) 2004-09-28
EP0992981A2 (en) 2000-04-12
US20080275698A1 (en) 2008-11-06
CN1167047C (zh) 2004-09-15
DE69712537T2 (de) 2002-08-29
KR100306817B1 (ko) 2001-11-14
EP0992982A3 (en) 2000-04-26
US20060235682A1 (en) 2006-10-19
EP1074977B1 (en) 2003-07-02
CN1169117C (zh) 2004-09-29
US6772115B2 (en) 2004-08-03
KR100304391B1 (ko) 2001-11-09
CN1223994C (zh) 2005-10-19
EP1071080A2 (en) 2001-01-24
EP1071077A3 (en) 2001-01-31
DE69708693D1 (de) 2002-01-10
EP0883107B9 (en) 2005-01-26
DE69712928D1 (de) 2002-07-04
EP1071079A3 (en) 2001-01-31
US6421639B1 (en) 2002-07-16
KR100326777B1 (ko) 2002-03-12
EP0994462A1 (en) 2000-04-19
DE69721595D1 (de) 2003-06-05
KR19990077080A (ko) 1999-10-25
EP0992981A3 (en) 2000-04-26
EP0991054B1 (en) 2001-11-28
EP1217614A1 (en) 2002-06-26
EP1071080A3 (en) 2001-01-31
US20050203736A1 (en) 2005-09-15
US20020007271A1 (en) 2002-01-17
DE69711715D1 (de) 2002-05-08
EP1071077B1 (en) 2002-05-08
US20100324892A1 (en) 2010-12-23
DE69715478D1 (de) 2002-10-17
CA2242345A1 (en) 1998-05-14
US6330534B1 (en) 2001-12-11
CN1338722A (zh) 2002-03-06
KR100306815B1 (ko) 2001-11-09
EP1074977A1 (en) 2001-02-07
CN1170269C (zh) 2004-10-06
EP1071081B1 (en) 2002-05-08
EP0883107B1 (en) 2004-08-18
EP1085504A2 (en) 2001-03-21
CN1338727A (zh) 2002-03-06
DE69712538T2 (de) 2002-08-29
EP0992982A2 (en) 2000-04-12
US20010039491A1 (en) 2001-11-08
KR20040000406A (ko) 2004-01-03
CN102129862B (zh) 2013-05-29
EP0994462B1 (en) 2002-04-03
DE69723324D1 (de) 2003-08-07
US6757650B2 (en) 2004-06-29
US20010034600A1 (en) 2001-10-25
DE69730316T2 (de) 2005-09-08
DE69712927T2 (de) 2003-04-03
EP0883107A4 (en) 2000-07-26
CN1170268C (zh) 2004-10-06
CA2242345C (en) 2002-10-01
DE69710505T2 (de) 2002-06-27
US7398205B2 (en) 2008-07-08
DE69721595T2 (de) 2003-11-27
CN1188833C (zh) 2005-02-09
EP1094447A3 (en) 2001-05-02
US20010027391A1 (en) 2001-10-04
US8086450B2 (en) 2011-12-27
US6453288B1 (en) 2002-09-17
KR100306814B1 (ko) 2001-11-09
KR100306816B1 (ko) 2001-11-09
CN1262994C (zh) 2006-07-05
EP1071079A2 (en) 2001-01-24
EP0991054A2 (en) 2000-04-05
EP0992982B1 (en) 2001-11-28
EP1136985B1 (en) 2002-09-11
EP1094447B1 (en) 2002-05-29
US7587316B2 (en) 2009-09-08
DE69708696D1 (de) 2002-01-10
CN1207195A (zh) 1999-02-03
DE69708696T2 (de) 2002-08-01
CN1495706A (zh) 2004-05-12
EP1085504B1 (en) 2002-05-29
DE69710794T2 (de) 2002-08-08
DE69712928T2 (de) 2003-04-03
DE69712535D1 (de) 2002-06-13
EP1071080B1 (en) 2002-05-08
EP1071078A2 (en) 2001-01-24
DE69723324T2 (de) 2004-02-19
EP1085504A3 (en) 2001-03-28
CN1338724A (zh) 2002-03-06
US20070100613A1 (en) 2007-05-03
HK1097945A1 (en) 2007-07-06
AU4884297A (en) 1998-05-29
EP0992981B1 (en) 2001-11-28
US7289952B2 (en) 2007-10-30
US7809557B2 (en) 2010-10-05
KR100339168B1 (ko) 2002-06-03
EP0991054A3 (en) 2000-04-12
US20020099540A1 (en) 2002-07-25
DE69708693T2 (de) 2002-08-01
KR20030096444A (ko) 2003-12-31
EP1071078A3 (en) 2001-01-31
CN1178204C (zh) 2004-12-01
US20120185242A1 (en) 2012-07-19
US6330535B1 (en) 2001-12-11
DE69712539D1 (de) 2002-06-13
DE69712927D1 (de) 2002-07-04
CN102129862A (zh) 2011-07-20
US6910008B1 (en) 2005-06-21
HK1017472A1 (en) 1999-11-19
EP1136985A2 (en) 2001-09-26
EP1071081A2 (en) 2001-01-24
US20100256975A1 (en) 2010-10-07
EP1071077A2 (en) 2001-01-24
DE69708697D1 (de) 2002-01-10
CN1338726A (zh) 2002-03-06
EP1074978A1 (en) 2001-02-07
US6947889B2 (en) 2005-09-20
CN1338723A (zh) 2002-03-06
DE69713633D1 (de) 2002-08-01

Similar Documents

Publication Publication Date Title
WO1998020483A1 (fr) Generateur de vecteur de source sonore, codeur et decodeur vocal
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
JPH10143198A (ja) 音声符号化装置/復号化装置
CA2551458C (en) A vector quantization apparatus
CA2355978C (en) Excitation vector generator, speech coder and speech decoder
EP1132894B1 (en) Vector quantisation codebook generation method
JP2007241297A (ja) 音声符号化装置

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 97191558.X

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): AL AM AT AU AZ BA BB BG BR BY CA CH CN CU CZ DE DK EE ES FI GB GE GH HU IL IS KE KG KR KZ LC LK LR LS LT LU LV MD MG MK MN MW MX NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT UA UG US UZ VN YU ZW AM AZ BY KG KZ MD RU TJ TM

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH KE LS MW SD SZ UG ZW AT BE CH DE DK ES FI FR GB GR IE IT LU MC NL PT SE

WWE Wipo information: entry into national phase

Ref document number: 09101186

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2242345

Country of ref document: CA

Ref document number: 2242345

Country of ref document: CA

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 1997911460

Country of ref document: EP

Ref document number: 1019980705215

Country of ref document: KR

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 1997911460

Country of ref document: EP

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

WWP Wipo information: published in national office

Ref document number: 1019980705215

Country of ref document: KR

WWG Wipo information: grant in national office

Ref document number: 1019980705215

Country of ref document: KR

WWG Wipo information: grant in national office

Ref document number: 1997911460

Country of ref document: EP