DE60214027T2 - Kodiervorrichtung und dekodiervorrichtung - Google Patents

Kodiervorrichtung und dekodiervorrichtung Download PDF

Info

Publication number
DE60214027T2
DE60214027T2 DE60214027T DE60214027T DE60214027T2 DE 60214027 T2 DE60214027 T2 DE 60214027T2 DE 60214027 T DE60214027 T DE 60214027T DE 60214027 T DE60214027 T DE 60214027T DE 60214027 T2 DE60214027 T2 DE 60214027T2
Authority
DE
Germany
Prior art keywords
frequency spectrum
parameter
spectrum
decoding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60214027T
Other languages
English (en)
Other versions
DE60214027D1 (de
Inventor
Mineo Katano-shi TSUSHIMA
Takeshi Kobe-shi NORIMATSU
Kosuke Kadoma-shi NISHIO
Naoya Neyagawa-shi TANAKA
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Application granted granted Critical
Publication of DE60214027D1 publication Critical patent/DE60214027D1/de
Publication of DE60214027T2 publication Critical patent/DE60214027T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Description

  • Gebiet der Erfindung
  • Die vorliegende Erfindung betrifft eine Codiervorrichtung, die Daten dadurch komprimiert, dass sie ein Signal, das durch Transformieren eines Audiosignals, wie etwa eines Ton- oder Musiksignals, im Zeitbereich in ein Audiosignal im Frequenzbereich erhalten wird, mit einem kleineren codierten Bitstrom nach einem Verfahren, wie etwa orthogonale Transformation, codiert, und eine Decodiervorrichtung, die die Daten nach Empfang des Codierte-Daten-Stroms dekomprimiert.
  • Hintergrund der Erfindung
  • Bisher sind zahlreiche Verfahren zur Codierung und Decodierung von Audiosignalen entwickelt worden. Insbesondere ist zurzeit IS 13818-7, ein von der ISO/IEC international standardisiertes Verfahren, allgemein bekannt und wird als Codierverfahren zur hocheffizienten Tonwiedergabe mit hoher Qualität sehr geschätzt. Dieses Codierverfahren heißt AAC. In den letzten Jahren wurde AAC für den mit MPEG4 bezeichneten Standard übernommen, und ein mit MPEG4-AAC bezeichnetes System mit einigen erweiterten Funktionen, die zu IS 31818-7 hinzugefügt worden sind, ist entwickelt worden. Ein Beispiel für das Codierverfahren ist im Informationsteil zu MPEG4-AAC beschrieben.
  • Nachstehend wird eine Audiocodiervorrichtung, die das herkömmliche Verfahren verwendet, unter Bezugnahme auf 1 beschrieben. 1 ist ein Blockdiagramm, das den Aufbau einer herkömmlichen Codiervorrichtung 100 zeigt. Die Codiervorrichtung 100 weist eine Spektrumverstärkungseinheit 101, eine Spektrumquantisierungseinheit 102, eine Huffman-Codiereinheit 103 und eine Codierter-Datenstrom-Übertragungseinheit 104 auf. Ein diskreter Audiosignalstrom im Zeitbereich, der durch Abtasten eines analogen Audiosignals mit einer festen Frequenz erhalten wird, wird in eine feste Anzahl von Abtastwerten in einem festen Zeitintervall unterteilt, über eine hier nicht dargestellte Zeit-Frequenz-Transformationseinheit in Daten im Frequenzbereich transformiert und dann an die Spektrumverstärkungseinheit 101 als Eingangssignal für die Codiervorrichtung 100 gesendet. Die Spektrumverstärkungseinheit 101 verstärkt Spektren, die in einem festgelegten Band enthalten sind, mit einer bestimmten Verstärkung für jedes festgelegte Band. Die Spektrumquantisierungseinheit 102 quantisiert die verstärkten Spektren mit einem festgelegten Umwandlungsausdruck. Beim AAC-Verfahren erfolgt die Quantisierung durch Abrunden der Frequenzspektrumsdaten, die mit einem Gleitkomma dargestellt werden, auf eine Ganzzahl. Die Huffman-Codiereinheit 103 codiert die quantisierten Spektrumsdaten in Gruppen aus bestimmten Einzeldaten mittels Huffman-Codierung und codiert die Verstärkung in jedem festgelegten Band in der Spektrumverstärkungseinheit 101 und codiert die Daten, die einen Umwandlungsausdruck für die Quantisierung festlegen, ebenfalls mittels Huffman-Codierung und sendet dann deren Codes an die Codierter-Datenstrom-Übertragungseinheit 104. Der Strom der mittels Huffman-Codierung codierten Daten wird von der Codierter-Datenstrom-Übertragungseinheit 104 über einen Übertragungskanal oder ein Aufzeichnungsmedium an eine Decodiervorrichtung gesendet und wird von der Decodiervorrichtung zu einem Audiosignal im Zeitbereich wiederhergestellt. Die herkömmliche Codiervorrichtung arbeitet in der vorstehend beschriebenen Weise.
  • Bei der herkömmlichen Codiervorrichtung 100 hängt die Komprimierungsleistung für die Datenmenge von der Leistung der Huffman-Codiereinheit 103 ab, sodass, wenn die Codierung mit einer hohen Komprimierungsrate, das heißt, mit einer kleinen Datenmenge, durchgeführt wird, die Verstärkung in der Spektrumverstärkungseinheit 101 wesentlich verringert werden muss und der quantisierte Spektralstrom, der mit der Spektrumquantisierungseinheit 102 erhalten wird, codiert werden muss, damit die Datengröße in der Huffman-Codiereinheit 103 kleiner wird. Wenn jedoch eine Codierung zur Verringerung der Datenmenge nach diesem Verfahren durchgeführt wird, wird die Bandbreite für die Wiedergabe von Ton und Musik zu schmal. Und so lässt es sich nicht leugnen, dass der Ton beim Hören belegt klingt. Dadurch kann die Tonqualität nicht aufrechterhalten werden. Das ist ein Problem.
  • EP 1 037 196 beschreibt ein Teilband-basiertes Verfahren zur Codierung von Audiosignalen, mit dem Informationen, die ein zu kopierendes niedrigeres Frequenzspektrum und seine entsprechende Verstärkung angeben, codiert werden, zur Wiedergabe eines höheren Frequenzspektrums mit einem Decodierer.
  • Ziel der vorliegenden Erfindung ist es, angesichts des vorgenannten Problems eine Codiervorrichtung, die Audiosignale mit einer hohen Komprimierungsrate codieren kann, und eine Decodiervorrichtung, die die codierten Audiosignale decodieren kann und Breitband-Frequenzspektrumsdaten und Breitband-Audiosignale wiedergeben kann, zur Verfügung zu stellen.
  • Beschreibung der Erfindung
  • Um das vorgenannte Problem zu lösen, wird in Anspruch 1 eine erfindungsgemäße Codiervorrichtung definiert, und Anspruch 7 definiert ein entsprechendes Codierverfahren. Die Hauptansprüche 15 und 21 definieren eine entsprechende Decodiervorrichtung bzw. ein entsprechendes Decodierverfahren.
  • Kurze Beschreibung der Zeichnungen
  • Diese und weitere Ziele, Vorzüge und Merkmale der Erfindung dürften aus der nachstehenden Beschreibung in Verbindung mit den beigefügten Zeichnungen hervorgehen, die spezielle Ausführungsformen der Erfindung zeigen. In den Zeichnungen sind:
  • 1 ein Blockdiagramm, das den Aufbau einer herkömmlichen Codiervorrichtung zeigt;
  • 2 ein Blockdiagramm, das den Aufbau einer Codiervorrichtung nach einer ersten Ausführungsform der vorliegenden Ausführungsform (Anm. d. Übers.: muss wohl „Erfindung" heißen) zeigt;
  • 3A ein Diagramm, das eine Serie von MDCT-Koeffizienten (MDCT: modifizierte diskrete Kosinustransformation), die mit einer MDCT-Einheit ausgegeben werden, zeigt;
  • 3B ein Diagramm, das den 0-ten bis (Max.-Linie – 1)-ten MDCT-Koeffizienten von den in 3A gezeigten MDCT-Koeffizienten zeigt;
  • 3C ein Diagramm, das ein Beispiel dafür zeigt, wie ein Codierte-Erweiterungsaudiodaten-Strom in der in 2 gezeigten BBE-Codiereinheit (BBE: Bandbreitenerweiterung) erzeugt wird;
  • 4A ein Wellenform-Diagramm, das eine Serie von MDCT-Koeffizienten eines Originaltons zeigt;
  • 4B ein Wellenform-Diagramm, das eine Serie von MDCT-Koeffizienten zeigt, die durch Ersetzung mit der BBE-Codiereinheit erzeugt werden;
  • 4C ein Wellenform-Diagramm, das eine Serie von MDCT-Koeffizienten zeigt, die erzeugt werden, wenn die Verstärkung der in 4B gezeigten MDCT-Koeffizientenserie geregelt wird;
  • 5A ein Diagramm, das ein Beispiel für einen normalen codierten Audio-Bitstrom zeigt;
  • 5B ein Diagramm, das ein Beispiel für einen codierten Audio-Bitstrom zeigt, der mit der Codiervorrichtung der vorliegenden Ausführungsform ausgegeben wird;
  • 5C ein Diagramm, das ein Beispiel für einen Codierte-Erweiterungsaudiodaten-Strom zeigt, der in dem in 5B gezeigten Codierte-Erweiterungsaudiodaten-Strom-Abschnitt dargestellt ist;
  • 6 ein Blockdiagramm, das den Aufbau einer Decodiervorrichtung zeigt, die den codierten Audio-Bitstrom decodiert, der von der in 2 gezeigten Codiervorrichtung ausgegeben wird;
  • 7 ein Diagramm, das zeigt, wie Frequenzspektrum-Erweiterungsdaten in der BBE-Codiereinheit einer zweiten Ausführungsform erzeugt werden;
  • 8A ein Diagramm, das niedrigere und höhere Teilbänder zeigt, die in der gleichen Weise wie bei der zweiten Ausführungsform geteilt werden;
  • 8B ein Diagramm, das ein Beispiel für eine Serie von MDCT-Koeffizienten in einem niedrigeren Teilband A zeigt;
  • 8C ein Diagramm, das ein Beispiel für eine Serie von MDCT-Koeffizienten in einem Teilband As zeigt, das durch Umkehren der Reihenfolge der MDCT-Koeffizienten in dem niedrigeren Teilband A erhalten wird;
  • 8D ein Diagramm, das ein Teilband Ar zeigt, das durch Umkehren der Vorzeichen der MDCT-Koeffizienten in dem niedrigeren Teilband A erhalten wird;
  • 9A ein Diagramm, das ein Beispiel für die MDCT-Koeffizienten in dem niedrigeren Teilband A zeigt, die für ein höheres Teilband h0 festgelegt werden;
  • 9B ein Diagramm, das ein Beispiel für die gleiche Anzahl von MDCT-Koeffizienten wie die in dem niedrigeren Teilband A zeigt, die mit einer Rauscherzeugungseinheit erzeugt werden;
  • 9C ein Diagramm, das ein Beispiel für die MDCT-Koeffizienten zeigt, die anstelle des höheren Teilbands h0 verwendet werden und unter Verwendung der MDCT-Koeffizienten in dem in 9A gezeigten niedrigeren Teilband und der MDCT-Koeffizienten erzeugt werden, die mit der in 9B gezeigten Rauscherzeugungseinheit erzeugt werden;
  • 10A ein Diagramm, das MDCT-Koeffizienten in einem Frame zum Zeitpunkt t0 zeigt;
  • 10B ein Diagramm, das MDCT-Koeffizienten im nächsten Frame zum Zeitpunkt t1 zeigt;
  • 10C ein Diagramm, das MDCT-Koeffizienten im übernächsten Frame zum Zeitpunkt t2 zeigt;
  • 11A ein Diagramm, das MDCT-Koeffizienten in einem Frame zum Zeitpunkt t0 zeigt;
  • 11B ein Diagramm, das MDCT-Koeffizienten im nächsten Frame zum Zeitpunkt t1 zeigt;
  • 11C ein Diagramm, das MDCT-Koeffizienten im übernächsten Frame zum Zeitpunkt t2 zeigt;
  • 12 ein Blockdiagramm, das den Aufbau einer Decodiervorrichtung zeigt, die Breitband-Zeit-Frequenz-Signale aus einem codierten Audio-Bitstrom decodiert, der unter Verwendung eines QMF-Filters (QMF: Quadratur-Spiegel-Filter) codiert wird; und
  • 13 ein Diagramm, das ein Beispiel für die Zeit-Frequenz-Signale zeigt, die von einer Decodiervorrichtung nach einer sechsten Ausführungsform decodiert werden.
  • Beschreibung der bevorzugten Ausführungsformen
  • Nachstehend werden die Codiervorrichtung und die Decodiervorrichtung nach den Ausführungsformen der vorliegenden Erfindung unter Bezugnahme auf die 2 bis 13 beschrieben.
  • Erste Ausführungsform
  • Zunächst wird die Codiervorrichtung beschrieben. 2 ist ein Blockdiagramm, das den Aufbau einer Codiervorrichtung 200 nach einer ersten Ausführungsform der vorliegenden Ausführungsform (Anm. d. Übers.: muss wohl „Erfindung" heißen) zeigt. Die Codiervorrichtung 200 ist eine Vorrichtung, die das Spektrum des niedrigeren Bands in Teilbänder in einer festen Frequenzbandbreite unterteilt und einen codierten Audio-Bitstrom mit Daten zum Festlegen des Teilbands ausgibt, das in das darin enthaltene höhere Frequenzband kopiert werden soll. Die Codiervorrichtung 200 weist eine Vorverarbeitungseinheit 201, eine MDCT-Einheit 202, eine Quantisierungseinheit 203, eine BBE-Codiereinheit 204 und eine Codierter-Datenstrom-Erzeugungseinheit 205 auf. Die Vorverarbeitungseinheit 201 legt unter Berücksichtigung der Änderung der Tonqualität infolge der Quantisierungsverzerrung bei der Codierung und/oder Decodierung fest, ob das eingegebene Audiosignal in jedem Frame, das kleiner als 2048 Abtastwerte ist (SHORT-Fenster), quantisiert werden soll, wobei der Zeitauflösung eine höhere Priorität gegeben wird, oder ob es bei allen 2048 Abtastwerten (LONG-Fenster) unverändert quantisiert werden soll. Die MDCT-Einheit 202 transformiert den von der Vorverarbeitungseinheit 201 ausgegebenen diskreten Audiosignalstrom im Zeitbereich mit der modifizierten diskreten Kosinustransformation (MDCT) und gibt das Frequenzspektrum im Frequenzbereich aus. Die Quantisierungseinheit 203 quantisiert das niedrigere Frequenzband des von der MDCT-Einheit 202 ausgegebenen Frequenzspektrums, codiert es mittels Huffman-Codierung und gibt es dann aus. Nach Empfang eines mit der MDCT-Einheit 202 erhaltenen MDCT-Koeffizienten unterteilt die BBE-Codiereinheit 204 das Spektrum des niedrigeren Bands von den empfangenen Spektren in Teilbänder mit einer festen Frequenzbandbreite und legt aufgrund des von der MDCT-Einheit 202 ausgegebenen Frequenzspektrums des höheren Bands das niedrigere Teilband fest, das in das höhere Frequenzband kopiert werden soll, das anstelle des Spektrums des höheren Bands verwendet wird. Die BBE-Codiereinheit 204 erzeugt die Frequenzspektrum-Erweiterungsdaten, die das festgelegte niedrigere Teilband für jedes höhere Teilband angeben, quantisiert gegebenenfalls die erzeugten Frequenzspektrum-Erweiterungsdaten und codiert sie mittels Huffman-Codierung, um einen Codierte-Erweiterungsaudiodaten-Strom auszugeben. Die Codierter-Datenstrom-Erzeugungseinheit 205 zeichnet den von der Quantisierungseinheit 203 ausgegebenen Codierte-Audiodaten-Strom des niedrigeren Bands und den von der BBE-Codiereinheit 204 ausgegebenen Codierte-Erweiterungsaudiodaten-Strom in den Codierte-Audiodaten-Strom-Abschnitt bzw. den Codierte-Erweiterungsaudiodaten-Strom-Abschnitt des im AAC-Standard definierten codierten Audio-Bitstroms auf und gibt sie nach außen aus.
  • Nachstehend wird die Funktionsweise der Codiervorrichtung 200 mit dem vorstehenden Aufbau beschrieben. Zunächst wird ein diskreter Audiosignalstrom, der beispielsweise mit einer Abtastfrequenz von 44,1 kHz in jedem Frame, das 2048 Abtastwerte enthält, abgetastet wird, in die Vorverarbeitungseinheit 201 eingegeben. Das Audiosignal in einem Frame ist nicht auf 2048 Abtastwerte beschränkt, aber zur Vereinfachung der später beschriebenen Decodiervorrichtung erfolgt die nachstehende Beschreibung für den Fall von 2048 Abtastwerten als Beispiel. Die Vorverarbeitungseinheit 201 legt aufgrund des eingegebenen Audiosignals fest, ob das eingegebene Audiosignal in einem LONG-Fenster oder in einem SHORT-Fenster codiert werden soll. Nachstehend wird der Fall beschrieben, dass die Vorverarbeitungseinheit 201 festlegt, dass das Audiosignal in einem LONG-Fenster codiert werden soll.
  • Der von der Vorverarbeitungseinheit 201 ausgegebene diskrete Audiosignalstrom wird in festen Intervallen aus einem diskreten Signal im Zeitbereich in Frequenzspektrumsdaten transformiert und anschließend ausgegeben. Als Zeit-Frequenz-Transformation wird normalerweise die MDCT verwendet. Als Intervall wird einer von 128, 256, 512, 1024 und 2048 Abtastwerten verwendet. Bei der MDCT kann die Anzahl von Abtastwerten des diskreten Signals im Zeitbereich die Gleiche wie die der Abtastwerte der transformierten Frequenzspektrumsdaten sein. MDCT ist Fachleuten gut bekannt. Bei der Beschreibung wird hier von der Voraussetzung ausgegangen, dass die Audiosignale aus 2048 Abtastwerten, die von der Vorverarbeitungseinheit 201 ausgegeben werden, in die MDCT-Einheit 202 eingegeben werden und die MDCT durchgeführt wird. Außerdem führt die MDCT-Einheit 202 auch die MDCT an den Audiosignalen unter Verwendung des vorhergehenden Frames (2048 Abtastwerte) und des neu eingegebenen Frames (2048 Abtastwerte) durch und gibt die MDCT-Koeffizienten von 2048 Abtastwerten aus. Die MDCT ist im Allgemeinen durch den folgenden Ausdruck 1 oder dergleichen gegeben:
    Figure 00090001
    worin Zi,n ein gefensterter eingegebener Audio-Abtastwert ist, n der Abtastwert-Index ist, k der Index des MDCT-Koeffizienten ist, i die Frame-Anzahl ist, N die Fensterlänge ist und n0 = (N/2 + 1)/2 ist. In der Regel werden bei der Codierung, wie etwa bei der Huffman-Codierung, die Frequenzspektrumsdaten, die wie vorstehend erhalten werden, durch Codes dargestellt, die voll reversibel und nicht-reversibel sind, was einer Datenkomprimierung entspricht, um den Codierte-Daten-Strom zu erzeugen. Hier werden die MDCT-Koeffizienten des niedrigeren Bands vom 0. bis zum 1023. Abtastwert, die Hälfte der MDCT-Koeffizienten von 2048 Abtastwerten, die in der Reihenfolge der Frequenzen von den niedrigeren Frequenzkomponenten zu den höheren Frequenzkomponenten ausgerichtet sind, in die Quantisierungseinheit 203 eingegeben. Die Quantisierungseinheit 203 quantisiert die eingegebenen MDCT-Koeffizienten nach einem Quantisierungsverfahren wie AAC und erzeugt den Codierte-Audiodaten-Strom des niedrigeren Bands. Im Allgemeinen ist bei einem Quantisierungsverfahren wie AAC die Anzahl der zu quantisierenden MDCT-Koeffizienten nicht definiert. Daher kann die Quantisierungseinheit 203 alle eingegebenen MDCT-Koeffizienten des niedrigeren Bands (1024 Koeffizienten) oder einen Teil davon quantisieren. Hier quantisiert und codiert die Quantisierungseinheit 203 die „Max.-Linie" Koeffizienten vom 0. bis (Max.-Linie – 1)-ten MDCT-Koeffizienten der MDCT-Koeffizienten. Hier ist „Max.-Linie" die obere Grenze der Frequenz für die MDCT-Koeffizienten, die von der herkömmlichen Codiervorrichtung quantisiert und codiert werden sollen. Alle MDCT-Koeffizienten (2048 Koeffizienten), die von der MDCT-Einheit 202 ausgegeben werden, werden in die BBE-Codiereinheit 204 eingegeben.
  • Nachstehend wird die Verarbeitung zur Erzeugung des Codierte-Erweiterungsaudiodaten-Stroms in der in 2 gezeigten BBE-Codiereinheit 204 unter Bezugnahme auf die 3A3C näher beschrieben. 3A ist ein Diagramm, das eine MDCT-Koeffizientenserie zeigt, die von der MDCT-Einheit 202 ausgegeben wird. 3B ist ein Diagramm, das den 0. bis (Max.-Linie – 1)-ten MDCT-Koeffizienten, die mit der Quantisierungseinheit 203 codiert werden, von den in 3A gezeigten MDCT-Koeffizienten zeigt. 3C ist ein Diagramm, das ein Beispiel dafür zeigt, wie ein Codierte-Erwieiterungsaudiodaten-Strom in der in 2 gezeigten BBE-Codiereinheit 204 erzeugt wird. In den 3A3C gibt die Abszissenachse die Frequenzen an und die Anzahl, 0 bis 2047, wird den MDCT-Koeffizienten von der niedrigeren zur höheren Frequenz zugewiesen. Die Ordinatenachse gibt die Werte der MDCT-Koeffizienten an. In diesen Figuren sind die Frequenzspektren durch kontinuierliche Wellenformen in Frequenzrichtung dargestellt. Aber sie sind keine kontinuierlichen Wellenformen, sondern diskrete Spektren. Wie in 3A gezeigt, können 2048 MDCT-Koeffizienten, die von der MDCT-Einheit 202 ausgegeben werden, einen Originalton darstellen, der über einen festen Zeitraum in der halben Breite des Frequenzbands der Abtastfrequenz mit der maximalen Bandbreite abgetastet wird. Im Allgemeinen kommt es bei der herkömmlichen Codiervorrichtung oft vor, dass von den in 3A gezeigten MDCT-Koeffizienten nur die MDCT-Koeffizienten des niedrigeren Bands, die für das Hören wichtig sind, beispielsweise bis zur „Max.-Linie", quantisiert und codiert werden und an die Decodiervorrichtung gesendet werden. Daher erzeugt die BBE-Codiereinheit 204 die Frequenzspektrum-Erweiterungsdaten, die die MDCT-Koeffizienten des höheren Bands der „Max.-Linie" oder darüber hinaus darstellen, die anstelle der in 3A gezeigten MDCT-Koeffizienten des höheren Bands verwendet werden. Mit anderen Worten, die BBE-Codiereinheit 204 will den (Max.-Linie)-ten bis (Ziellinie – 1)-ten MDCT-Koeffizienten, die in 3C gezeigt sind, codieren, da der 0. bis (Max.-Linie – 1)-te Koeffizient vorher mit der Quantisierungseinheit 203 codiert werden.
  • Zunächst nimmt die BBE-Codiereinheit 204 den Bereich in dem höheren Frequenzband (insbesondere den Frequenzbereich von der „Max.-Linie" bis zur „Ziellinie") an, in dem die Daten als Audiosignal in der Decodiervorrichtung wiedergegeben werden sollen, und unterteilt den angenommenen Bereich in Teilbänder mit einer festen Frequenzbandbreite. Außerdem unterteilt die BBE-Codiereinheit 204 das gesamte niedrigere Frequenzband, oder einen Teil davon, mit dem 0. bis (Max.-Linie – 1)-ten MDCT-Koeffizienten von den eingegebenen MDCT-Koeffizienten und legt die niedrigeren Frequenzbänder fest, die anstelle der entsprechenden höheren Frequenzbänder mit dem (Max.-Linie)-ten bis 2047. MDCT-Koeffizienten verwendet werden können. Als niedrigere Frequenzbänder, die anstelle der einzelnen höheren Teilbänder verwendet werden können, werden die niedrigeren Frequenzbänder festgelegt, bei denen die Differenz zwischen ihrer Energie und der Energie des höheren Teilbands minimal ist. Oder es kann das niedrigere Teilband festgelegt werden, bei dem die Position des MDCT-Koeffizienten im Frequenzbereich, deren Absolutwert maximal ist, der Position des MDCT-Koeffizienten des höheren Bands am nächsten kommt.
  • Bei der in 3C gezeigten BBE-Codiereinheit 204 wird das Bestehen der folgenden Beziehung (Ausdruck 2) zwischen „Startlinie", „Ziellinie", „Endlinie" und „sbw", das die Anzahl der MDCT-Koeffizienten darstellt, angenommen: Endlinie = Max.-Linie – Shiftlen Startlinie = Endlinie – W·sbw Ziellinie = Max.-Linie + V·sbw (Ausdruck 2),worin W beispielsweise 4 ist und V beispielsweise 8 ist. Hier kann „Shiftlen" ein vorgegebener Wert sein oder er kann in Abhängigkeit von dem eingegebenen MDCT-Koeffizienten berechnet werden, und die Daten, die den Wert angeben, können in der BBE-Codiereinheit 204 codiert werden.
  • 3C zeigt den Fall, dass wenn das höhere Frequenzband in acht Teilbänder, das heißt, die MDCT-Koeffizienten h0 bis h7, unterteilt wird, wobei die Frequenzbandbreite sbw MDCT-Koeffizienten-Abtastwerte enthält, das niedrigere Frequenzband vier MDCT-Koeffizienten-Teilbänder A, B, C und D mit jeweils sbw Abtastwerten haben kann. In diesem Fall wird aus praktischen Gründen der Bereich zwischen der Startlinie und der Endlinie in vier Teilbänder unterteilt, und der Bereich zwischen der Max.-Linie und der Ziellinie wird in acht Teilbänder unterteilt, aber die Anzahl der Teilbänder und die Anzahl der Abtastwerte in einem Teilband sind nicht immer auf diese Angaben beschränkt. Die BBE-Codiereinheit 204 legt die niedrigeren Teilbänder A, B, C und D mit der Frequenzbandbreite sbw, die anstelle der MDCT-Koeffizienten in den höheren Teilbändern h0 bis h7 verwendet werden, mit derselben Frequenzbandbreite sbw fest und codiert sie. Hier bedeutet „Verwendung anstelle der MDCT-Koeffizienten", dass ein Teil der erhaltenen MDCT-Koeffizienten, in diesem Fall die MDCT-Koeffizienten der niedrigeren Teilbänder A–D, als MDCT-Koeffizienten in die höheren Teilbänder h0 bis h7 kopiert werden. Diese Ersetzung kann den Fall umfassen, dass die Verstärkung der ersetzten MDCT-Koeffizienten geregelt wird.
  • Bei der BBE-Codiereinheit 204 beträgt die Datenmenge, die zum Darstellen des niedrigeren Teilbands benötigt wird, das anstelle des höheren Teilbands verwendet wird, höchstens 2 Bit für jedes höhere Teilband h0 bis h7, da sie den Bedarf erfüllt, wenn eines der vier niedrigeren Teilbänder A–D für jedes höhere Teilband festgelegt werden kann. Wie vorstehend dargelegt, codiert die BBE-Codiereinheit 204 die Frequenzspektrum-Erweiterungsdaten, die angeben, welches niedrigere Teilband A–D anstelle der höheren Teilbänder h0 bis h7 verwendet wird, und erzeugt den Codierte-Erweiterungsaudiodaten-Strom mit dem Codierte-Daten-Strom des niedrigeren Teilbands.
  • Die BBE-Codiereinheit 204 stellt außerdem die Amplitude des erzeugten Codierte-Erweiterungsaudiodaten-Stroms ein. 4A ist ein Wellenform-Diagramm, das eine Serie von MDCT-Koeffizienten eines Originaltons zeigt. 4B ist ein Wellenform-Diagramm, das eine Serie von MDCT-Koeffizienten zeigt, die durch Ersetzen mit der BBE-Codiereinheit 204 erzeugt werden. 4C ist ein Wellenform-Diagramm, das eine Serie von MDCT-Koeffizienten zeigt, die erzeugt werden, wenn die Verstärkung der in 4B gezeigten Serie der MDCT-Koeffizienten geregelt wird. Wie in 4A gezeigt, unterteilt die BBE-Codiereinheit 204 die MDCT-Koeffizienten des höheren Bands von der Max.-Linie bis zu Ziellinie in mehrere Bänder und codiert die Verstärkungsdaten für jedes Band. Das Band von der Max.-Linie bis zur Ziellinie kann zum Codieren der Verstärkungsdaten nach demselben Verfahren wie für die in 3 gezeigten höheren Teilbänder h0 bis h7 oder nach anderen Verfahren unterteilt werden. Nachstehend wird der Fall, dass dasselbe Verfahren verwendet wird, unter Bezugnahme auf 4 erläutert.
  • Die in dem höheren Teilband h0 enthaltenen MDCT-Koeffizienten des Originaltons sind x(0), x(1), ..., x(sbw – 1), wie in 4A gezeigt, die MDCT-Koeffizienten in dem höheren Teilband h0, die durch die Ersetzung erhalten werden, sind r(0), r(1), ..., r(sbw – 1), wie in 4B gezeigt, und die MDCT-Koeffizienten in dem Teilband h0 in 4C sind y(0), y(1), ..., y(sbw – 1). Die Verstärkung g0 wird für die Matrix x, r und y mit dem folgenden Ausdruck 3 erhalten und dann codiert:
    Figure 00130001
  • Für die höheren Teilbänder h0 bis h7 werden die Verstärkungsdaten in der gleichen Weise wie vorstehend berechnet und codiert. Diese Verstärkungsdaten g0 bis g7 werden mit einer festgelegten Anzahl von Bits in den Codierte-Erweiterungsaudiodaten-Strom codiert.
  • Der wie vorstehend codierte Codierte-Erweiterungsaudiodaten-Strom wird in dem von der Codiervorrichtung 200 ausgegebenen codierten Audio-Bitstrom festgelegt, der schematisch in 5 dargestellt ist. 5A ist ein Diagramm, das ein Beispiel für einen normalen codierten Audio-Bitstrom zeigt. 5B ist ein Diagramm, das ein Beispiel für einen codierten Audio-Bitstrom zeigt, der mit der Codiervorrichtung 200 der vorliegenden Ausführungsform ausgegeben wird. 5C ist ein Diagramm, das ein Beispiel für einen Codierte-Erweiterungsaudiodaten-Strom zeigt, der in dem in 5B gezeigten Codierte-Erweiterungsaudiodaten-Strom-Abschnitt dargestellt ist. Wie in 5A gezeigt, verwendet die Codiervorrichtung 200 beim Erzeugen des codierten Audio-Bitstroms in den einzelnen Frames in einem Strom 1 einen Teil jedes Frames (beispielsweise den schraffierten Bereich) als Codierte-Erweiterungsaudiodaten-Strom-Abschnitt in einem in 5B gezeigten Strom 2. Dieser Codierte-Erweiterungsaudiodaten-Strom-Abschnitt ist ein Bereich des in MPEG2-AAC und MPEG4-AAC beschriebenen „data_stream_element". Dieses data_stream_element ist ein Reservebereich zum Festlegen von Daten für die Erweiterung beim Erweitern der Funktionen des herkömmlichen Codiersystems und wird von der herkömmlichen Decodiervorrichtung auch dann nicht als Codierte-Audiodaten-Strom erkannt, wenn dort irgendeine Art von Daten aufgezeichnet ist. Das data_stream_element ist außerdem ein Bereich zum Auffüllen mit sinnlosen Daten, wie etwa 0, um die Länge der codierten Audiodaten konstant zu halten, bei MPEG2-AAC und MPEG4-AAC beispielsweise der Bereich des Füll-Elements. Dadurch, dass der Codierte-Erweiterungsaudiodaten-Strom in diesem Bereich in dem codierten Audio-Bitstrom dargestellt wird, kommt es bei der Wiedergabe des Codierte-Erweiterungsaudiodaten-Stroms als Audiosignal auch dann nicht zum Rauschen, wenn der erfindungsgemäße codierte Audio-Bitstrom mit der herkömmlichen Decodiervorrichtung decodiert wird, sodass das Audiosignal mit derselben Bandbreite wie das herkömmliche Audiosignal wiedergegeben werden kann.
  • Wie in 5C gezeigt, sind in dem Codierte-Erweiterungsaudiodaten-Strom ein Datenelement, das angibt, ob die niedrigeren Teilbänder A–D, die nach demselben Verfahren wie der Codierte-Erweiterungsaudiodaten-Strom im letzten Frame unterteilt werden, verwendet werden oder nicht, und Datenelemente, die die MDCT-Koeffizienten für die einzelnen höheren Teilbändern h0 bis h7 angeben, dargestellt. In den Datenelementen, die die MDCT- Koeffizienten für die einzelnen höheren Teilbänder h0 bis h7 angeben, sind die Daten, die die festgelegten niedrigeren Teilbänder A–D angeben, und deren Verstärkungsdaten dargestellt. In dem Datenelement, das angibt, ob die niedrigeren Teilbänder A–D, die die Gleichen wie der Codierte-Erweiterungsaudiodaten-Strom im letzten Frame sind, verwendet werden oder nicht, wird „1" angegeben, wenn die MDCT-Koeffizienten der höheren Teilbänder h0 bis h7 unter Verwendung eines der niedrigeren Teilbänder, die nach demselben Verfahren wie das letzte Frame unterteilt werden, ersetzt werden, und andernfalls, das heißt, wenn sie unter Verwendung eines der niedrigeren Teilbänder A–D ersetzt werden, die nach einem neuen Verfahren, das von dem für das letzte Frame verschieden ist, unterteilt werden, wird „0" angegeben. In diesen Datenelementen, die das festgelegte niedrigere Teilband von den Teilbändern A–D angeben, sind Daten mit 2 Bit dargestellt, die eines der vier niedrigeren Teilbänder A–D festlegen. Außerdem sind die Verstärkungsdaten beispielsweise mit 4 Bit dargestellt. Dadurch können die MDCT-Koeffizienten des höheren Bands für ein Frame durch den Codierte-Erweiterungsaudiodaten-Strom von 1 + 8 × (2 + 4) = 49 Bit dargestellt werden, wenn die höheren Teilbänder h0 bis h7 durch die niedrigeren Teilbänder A–D ersetzt werden, die in der gleichen Weise wie das letzte Frame unterteilt werden. Außerdem kann in dem Frame, das die niedrigeren Teilbänder A–D wie das letzte Frame verwendet, der Codierte-Erweiterungsaudiodaten-Strom nur durch 1 Bit, das beispielsweise den Wert „1" angibt, dargestellt werden.
  • Dadurch kann, wenn das von der erfindungsgemäßen Codiervorrichtung 200 durchgeführte Audiosignal-Codierverfahren auf das herkömmliche Codierverfahren angewendet wird, das höhere Frequenzband unter Verwendung des Codierte-Erweiterungsaudiodaten-Stroms mit einer kleinen Datenmenge dargestellt werden und der Breitband-Audioton kann mit einer guten Tonqualität in dem höheren Frequenzband wiedergegeben werden.
  • Nachstehend wird die Decodiervorrichtung beschrieben.
  • Beim Decodierverfahren wird ein eingegebener Codierte-Audiodaten-Strom decodiert, um Frequenzspektrumsdaten zu erhalten, das Frequenzspektrum im Frequenzbereich wird in Daten im Zeitbereich transformiert, und dadurch wird ein Audiosignal im Zeitbereich wiedergegeben.
  • 6 ist ein Blockdiagramm, das den Aufbau einer Decodiervorrichtung 600 zeigt, die den von der in 2 gezeigten Codiervorrichtung 200 ausgegebenen codierten Audio-Bitstrom decodiert. Die Decodiervorrichtung 600 ist eine Decodiervorrichtung, die den codierten Audio-Bitstrom, der den Codierte-Erweiterungsaudiodaten-Strom enthält, decodiert und Breitband-Frequenzspektrumsdaten ausgibt. Sie weist eine Codierte-Datenstrom-Teilungseinheit 601, eine Dequantisierungseinheit 602, eine IMDCT-Einheit 603 (IMDCT: inverse modifizierte diskrete Kosinustransformation), eine Rauscherzeugungseinheit 604, eine BBE-Decodiereinheit 605 und eine Erweiterte-IMDCT-Einheit 606 auf. Die Codierte-Datenstrom-Teilungseinheit 601 teilt den eingegebenen codierten Audio-Bitstrom in einen Codierte-Audiodaten-Strom, der das niedrigere Frequenzband darstellt, und einen Codierte-Erweiterungsaudiodaten-Strom, der das höhere Frequenzband darstellt, und gibt den abgetrennten Codierte-Audiodaten-Strom und den abgetrennten Codierte-Erweiterungsaudiodaten-Strom an die Dequantisierungseinheit 602 bzw. die BBE-Decodiereinheit 605 aus. Die Dequantisierungseinheit 602 dequantisiert den von dem codierten Audio-Bitstrom abgetrennten Codierte-Audiodaten-Strom und gibt die MDCT-Koeffizienten des niedrigeren Bands aus. Es sei darauf hingewiesen, dass die Dequantisierungseinheit 602 sowohl den Codierte-Audiodaten-Strom als auch den Codierte-Erweiterungsaudiodaten-Strom empfangen kann. Außerdem stellt die Dequantisierungseinheit 602 die MDCT-Koeffizienten durch Dequantisierung nach dem AAC-Verfahren wieder her, wenn es als Quantisierungsverfahren in der Quantisierungseinheit 203 verwendet wurde. Dadurch stellt die Dequantisierungseinheit 602 den 0. bis (Max.-Linie – 1)-ten MDCT-Koeffizienten des niedrigeren Bands wieder her und gibt sie aus.
  • Die IMDCT-Einheit 603 führt eine Frequenz-Zeit-Transformation an den von der Dequantisierungseinheit 602 ausgegebenen MDCT-Koeffizienten des niedrigeren Bands mittels IMDCT durch und gibt das Audiosignal des niedrigeren Bands im Zeitbereich aus. Insbesondere wenn die IMDCT-Einheit 603 die von der Dequantisierungseinheit 602 ausgegebenen MDCT-Koeffizienten des niedrigeren Bands empfängt, wird ein Audio-Ausgangssignal mit 1024 Abtastwerten für jedes Frame erhalten. Hier führt die IMDCT-Einheit 603 eine IMDCT-Operation für 1024 Abtastwerte durch. Der Ausdruck für die IMDCT-Operation ist im Allgemeinen durch den folgenden Ausdruck 4 gegeben:
    Figure 00170001
    worin n der Abtastwert-Index ist, k der Index des MDCT-Koeffizienten ist, i der Fenster-Index ist, N die Fensterlänge ist und n0 = (N/2 + 1)/2 ist.
  • Der Codierte-Erweiterungsaudiodaten-Strom, der mit der Codierte-Datenstrom-Teilungseinheit 601 von dem codierten Audio-Bitstrom abgetrennt wird, wird an die BBE-Decodiereinheit 605 ausgegeben. Außerdem werden der 0. bis (Max.-Linie – 1)-te MDCT-Koeffizient des niedrigeren Bands, die von der Dequantisierungseinheit 602 ausgegeben werden, und das Ausgangssignal von der Rauscherzeugungseinheit 604 in die BBE-Decodiereinheit 605 eingegeben. Die Operationen der BBE-Decodiereinheit 605 werden nachstehend näher erläutert. Die BBE-Decodiereinheit 605 decodiert und dequantisiert den (Max.-Linie)-ten bis 2047. MDCT-Koeffizienten des höheren Bands aufgrund der durch Decodieren des abgetrennten Codierte-Erweiterungsaudiodaten-Stroms erhaltenen Frequenzspektrum-Erweiterungsdaten und gibt den 0. bis 2047. Breitband-MDCT-Koeffizienten durch Addieren des 0. bis (Max.-Linie – 1)-ten MDCT-Koeffizienten des niedrigeren Bands, die mit der Dequantisierungseinheit 602 erhalten werden, zu dem (Max.-Linie)-ten bis 2047. MDCT-Koeffizienten des höheren Bands aus. Die Erweiterte-IMDCT-Einheit 606 führt die IMDCT-Operationen an den Abtastwerten doppelt so oft wie die IMDCT-Einheit 603 durch und erhält dann das Breitband-Audio-Ausgangssignal mit 2048 Abtastwerten für jedes Frame.
  • Nachstehend werden die Operationen der BBE-Decodiereinheit 605 näher beschrieben. Die BBE-Decodiereinheit 605 stellt den (Max.-Linie)-ten bis (Ziellinie)-ten MDCT-Koeffizienten unter Verwendung des 0. bis (Max.-Linie – 1)-ten MDCT-Koeffizienten, die mit der Dequantisierungseinheit 602 erhalten werden, und des Codierte-Erweiterungsaudiodaten-Stroms wieder her. Die Startlinie, die Endlinie, die Max.-Linie, die Ziellinie, sbw und Shiftlen haben alle die gleichen Werte wie die, die von der BBE-Codiereinheit 204 aufseiten der Codiervorrichtung 200 verwendet werden. Wie in 5C gezeigt, werden die Daten, die die niedrigeren Teilbänder A–D angeben, die anstelle der MDCT-Koeffizienten in den höheren Teilbändern h0 bis h7 verwendet werden, in dem Codierte-Erweiterungsaudiodaten-Strom codiert. Daher werden aufgrund der Daten die MDCT-Koeffizienten in den höheren Teilbändern h0 bis h7 jeweils durch festgelegte MDCT-Koeffizienten in den niedrigeren Teilbändern A–D ersetzt.
  • Dadurch erhält die BBE-Decodiereinheit 605 den 0. bis (Ziellinie)-ten MDCT-Koeffizienten. Außerdem regelt die BBE-Decodiereinheit 605 die Verstärkung aufgrund der Verstärkungsdaten in dem Codierte-Erweiterungsaudiodaten-Strom. Wie in 4B gezeigt, erzeugt die BBE-Decodiereinheit 605 eine Serie von MDCT-Koeffizienten, die durch die der niedrigeren Teilbänder A–D in den entsprechenden höheren Teilbändern h0 bis h7 von der Max.-Linie bis zu Ziellinie ersetzt werden. Wenn der Ersatz-MDCT-Koeffizient in dem höheren Teilband h0 r(0), r(1), ..., r(sbw – 1) ist und die aus dem Codierte-Erweiterungsaudiodaten-Strom erhaltenen Verstärkungsdaten für das höhere Teilband h0 g0 sind, kann die BBE-Decodiereinheit 605 die in 4C gezeigte Serie von verstärkungsgeregelten MDCT-Koeffizienten nach dem folgenden Beziehungsausdruck 5 erhalten. Insbesondere wenn der MDCT-Koeffizient für das höhere Teilband h0 y(0), y(1), ..., y(sbw – 1) ist, wird der Wert des verstärkungsgeregelten i-ten MDCT-Koeffizienten y(i) durch den folgenden Ausdruck 5 dargestellt: yi = g0·ri (Ausdruck 5).
  • In der gleichen Weise können für die höheren Teilbänder h1 bis h7 die verstärkungsgeregelten MDCT-Koeffizienten durch Multiplizieren der Ersatz-MDCT-Koeffizienten mit den Verstärkungsdaten für die einzelnen höheren Teilbänder g1 bis g7 erhalten werden. Die Rauscherzeugungseinheit 604 erzeugt weißes Rauschen, Rosa-Rauschen oder Rauschen, das eine Zufallskombination aus allen oder einigen MDCT-Koeffizienten des niedrigeren Bands ist, und addiert das erzeugte Rauschen zu den verstärkungsgeregelten MDCT-Koeffizienten. Dabei kann die Energie des addierten Rauschens und des Spektrums, das mit dem Spektrum kombiniert ist, das aus dem niedrigeren Frequenzband kopiert wurde, zu der Energie des Spektrums korrigiert werden, das durch den Ausdruck 5 dargestellt wird.
  • Bei der ersten Ausführungsform ist die Codierung der Verstärkungsdaten beschrieben worden, die mit den Ersatz-MDCT-Koeffizienten nach Ausdruck 5 multipliziert werden müssen. Es können aber auch die Verstärkungsdaten, die keine relativen Verstärkungswerte, sondern Absolutwerte sind, wie etwa die Energie oder die mittleren Amplituden der MDCT-Koeffizienten, codiert oder decodiert werden.
  • Unter Verwendung der BBE-Decodiereinheit 605 mit dem vorstehenden Aufbau kann Breitband-Audioton insbesondere im höheren Frequenzband auch dann mit guter Tonqualität wiedergegeben werden, wenn ein durch eine kleine Datenmenge dargestellter Codierte-Erweiterungsaudiodaten-Strom verwendet wird.
  • Es ist zwar dargelegt worden, dass die Codiervorrichtung 200 und die Decodiervorrichtung 600 das AAC-Verfahren verwenden, aber die Codiervorrichtung und die Decodiervorrichtung der vorliegenden Erfindung sind nicht darauf beschränkt, und es kann jedes andere Codierverfahren verwendet werden.
  • In der Codiervorrichtung 200 werden der 0. bis 2047. MDCT-Koeffizient von der MDCT-Einheit 202 an die BBE-Codiereinheit 204 ausgegeben. Die BBE-Codiereinheit 204 kann aber zusätzlich die Quantisierungsverzerrung enthaltende MDCT-Koeffizienten empfangen, die durch Dequantisieren der mit der Quantisierungseinheit 203 quantisierten MDCT-Koeffizienten erhalten werden. Außerdem kann die BBE-Codiereinheit 204 die MDCT-Koeffizienten empfangen, die durch Dequantisieren des Ausgangssignals von der Quantisierungseinheit 203 für das 0. bis (Max.-Linie – 1)-te niedrigere Teilband bzw. des Ausgangssignals von der MDCT-Einheit 202 für das (Max.-Linie)-te bis (Ziellinie)-te höhere Teilband erhalten werden.
  • Bei der ersten Ausführungsform ist dargelegt worden, dass die Frequenzspektrum-Erweiterungsdaten gegebenenfalls quantisiert und codiert werden. Aber als Codierte-Erweiterungsaudiodaten-Strom können natürlich auch die zu codierenden Daten (Frequenzspektrum-Erweiterungsdaten) verwendet werden, die mittels Codierung mit variabler Länge, wie etwa Huffman-Codierung, dargestellt werden. In Reaktion auf diese Codierung braucht die Decodiervorrichtung den Codierte-Erweiterungsaudiodaten-Strom nicht zu dequantisieren, sondern sie kann Codes mit variabler Länge, wie etwa Huffman-Codes, decodieren.
  • Bei der ersten Ausführungsform ist der Fall beschrieben worden, dass die erfindungsgemäßen Codier- und Decodierverfahren für MPEG2-AAC und MPEG4-AAC gelten. Die vorliegende Erfindung ist jedoch nicht darauf beschränkt, sondern sie kann für andere Codierverfahren, wie etwa MPEG1-Audio und MPEG2-Audio, verwendet werden. Wenn MPEG1-Audio und MPEG2-Audio verwendet werden, wird der Codierte-Erweiterungsaudiodaten-Strom für "ancillary_data" verwendet, die in diesen Standards beschrieben sind.
  • Bei der ersten Ausführungsform ist dargelegt worden, dass die höheren Teilbänder durch das Frequenzspektrum in den niedrigeren Teilbändern in einem Bereich des Frequenzspektrums (MDCT-Koeffizienten) ersetzt werden, der durch Durchführen der Zeit-Frequenz-Transformation an dem eingegebenen Audiosignal erhalten wird. Die vorliegende Erfindung ist jedoch nicht darauf beschränkt, sondern die höheren Teilbänder können bis zu einem Bereich über die obere Grenze der Frequenz des durch die Zeit-Frequenz-Transformation ausgegebenen Frequenzspektrums hinaus ersetzt werden. In diesem Fall kann das für die Ersetzung verwendete niedrigere Teilband nicht aufgrund des Frequenzspektrums (der MDCT-Koeffizienten) des höheren Bands, das den Originalton darstellt, festgelegt werden.
  • Zweite Ausführungsform
  • Die zweite Ausführungsform der vorliegenden Erfindung unterscheidet sich von der ersten Ausführungsform dadurch, dass die BBE-Codiereinheit 204 bei der ersten Ausführungsform eine Serie von MDCT-Koeffizienten des niedrigeren Bands von der Startlinie bis zu Endlinie in vier Teilbänder A–D unterteilt, während die BBE-Codiereinheit bei der zweiten Ausführungsform dieselbe Bandbreite von der Startlinie bis zur Endlinie in sieben Teilbänder A–G unterteilt, wobei sich die gleichen Teile dieser Teilbänder überschneiden. Die Codiervorrichtung und die Decodiervorrichtung der zweiten Ausführungsform haben grundsätzlich den gleichen Aufbau wie die Codiervorrichtung 200 und die Decodiervorrichtung 600 der ersten Ausführungsform, und die zweite Ausführungsform unterscheidet sich von der ersten Ausführungsform nur in der Verarbeitung, die mit der BBE-Codiereinheit 701 in der Codiervorrichtung und der BBE-Decodiereinheit 702 in der Decodiervorrichtung durchgeführt wird. Daher werden bei der zweiten Ausführungsform nur die BBE-Codiereinheit 701 und die BBE-Decodiereinheit 702 mit geänderten Bezugssymbolen beschrieben, und den anderen Komponenten in der Codiervorrichtung 200 und der Decodiervorrichtung 600 der ersten Ausführungsform, die bereits erläutert worden sind, werden die gleiche Bezugssymbole zugewiesen, und sie werden hier nicht beschrieben. Außerdem werden bei den folgenden Ausführungsformen nur die Punkte beschrieben, die von der vorstehenden Beschreibung abweichen, und die Punkte, die nicht abweichen, werden weggelassen.
  • Nachstehend wird die BBE-Codiereinheit 701 bei der zweiten Ausführungsform unter Bezugnahme auf 7 erläutert. 7 ist ein Diagramm, das zeigt, wie Frequenzspektrum-Erweiterungsdaten in der BBE-Codiereinheit 701 der zweiten Ausführungsform erzeugt werden. In dieser Figur sind die niedrigeren Teilbänder E, F und G Teilbänder, die dadurch erhalten werden, dass die niedrigeren Teilbänder A, B und C der Teilbänder A, B, C und D, die in der gleichen Weise wie die bei der ersten Ausführungsform unterteilt werden, in Richtung der höheren Frequenz um sbw/2 verschoben werden. Hier werden die niedrigeren Teilbänder A, B und C in Richtung der höheren Frequenz um sbw/2 verschoben, aber das Verfahren zum Teilen des Bands in Teilbänder, wobei sich einige Teile der Teilbänder überschneiden, die Frequenzbreite zum Verschieben der Teilbänder, die Anzahl der geteilten Teilbänder usw. sind nicht immer auf die vorstehenden beschränkt. Die BBE-Codiereinheit 701 erzeugt und codiert die Daten, die eines der sieben niedrigeren Teilbänder A–G festlegen, die anstelle der einzelnen höheren Teilbänder h0 bis h7 verwendet werden.
  • Die Decodiervorrichtung der zweiten Ausführungsform empfängt den Codierte-Erweiterungsaudiodaten-Strom, der mit der Codiervorrichtung der zweiten Ausführungsform codiert wird (die die BBE-Codiereinheit 701 anstelle der BBE-Codiereinheit 204 in der Codiervorrichtung 200 enthält), decodiert die Daten, die die MDCT-Koeffizienten in den niedrigeren Teilbändern A–G festlegen, die anstelle der höheren Teilbänder h0 bis h7 verwendet werden, und ersetzt die MDCT-Koeffizienten in den höheren Teilbändern h0 bis h7 durch die MDCT-Koeffizienten in den niedrigeren Teilbändern A–G.
  • Nehmen wir an, dass die Daten, die eines der niedrigeren Teilbänder A–G festlegen, beispielsweise durch Code-Daten aus 3 Bit dargestellt werden. Wenn die Ganzzahlen 0 bis 6 als Code-Daten jeweils die niedrigeren Teilbänder A–G darstellen, kann die Decodiervorrichtung die Steuerung so durchführen, dass sie keine Ersetzung unter Verwendung eines der Teilbänder A–G vornimmt, wenn die durch den Wert „7" dargestellten Code-Daten erzeugt werden. Hier ist der Fall beschrieben worden, dass Daten von 3 Bit als Code-Daten verwendet werden und der Wert der Code-Daten „7" ist, aber die Anzahl der Bits der Code-Daten und die Werte der Code-Daten können auch andere Werte sein.
  • Die Verstärkungsregelung und/oder die Rauschaddition, die bei der ersten Ausführungsform verwendet werden, werden bei der zweiten Ausführungsform in der gleichen Weise verwendet. Wenn die Codiervorrichtung und die Decodiervorrichtung mit dem vorstehend beschriebenen Aufbau verwendet werden, kann ein im Breitband wiedergegebener Ton unter Verwendung des Codierte-Erweiterungsaudiodaten-Stroms ohne eine große Datenmenge erhalten werden.
  • Dritte Ausführungsform
  • Die dritte Ausführungsform unterscheidet sich von der zweiten Ausführungsform dadurch, dass die BBE-Codiereinheit 701 bei der zweiten Ausführungsform eine Serie von MDCT-Koeffizienten des niedrigeren Bands von der Startlinie bis zu Endlinie in sieben Teilbänder A–G unterteilt, wobei sich einige Teile der Teilbänder überschneiden, während die BBE-Codiereinheit bei der dritten Ausführungsform dieselbe Bandbreite von der Startlinie bis zur Endlinie in sieben Teilbänder A–G unterteilt und die MDCT-Koeffizienten in den niedrigeren Teilbändern in umgekehrter Reihenfolge und die MDCT-Koeffizienten in den niedrigeren Teilbändern, deren positive und negative Vorzeichen umgekehrt werden, definiert.
  • Die Komponenten der dritten Ausführungsform, die sich von denen der Codiervorrichtung 200 und der Decodiervorrichtung 600 der ersten und zweiten Ausführungsform unterscheiden, sind nur die BBE-Codiereinheit 801 in der Codiervorrichtung und die BBE-Decodiereinheit 802 in der Decodiervorrichtung. Nachstehend wird die BBE-Codiereinheit bei der dritten Ausführungsform unter Bezugnahme auf 8 erläutert.
  • Die 8A8D sind Diagramme, die zeigen, wie die BBE-Codiereinheit 801 bei der dritten Ausführungsform die Frequenzspektrum-Erweiterungsdaten erzeugt. 8A ist ein Diagramm, das niedrigere und höhere Teilbänder zeigt, die in der gleichen Weise wie bei der zweiten Ausführungsform geteilt werden. 8B ist ein Diagramm, das ein Beispiel für eine Serie von MDCT-Koeffizienten in dem niedrigeren Teilband A zeigt. 8C ist ein Diagramm, das ein Beispiel für eine Serie von MDCT-Koeffizienten in einem Teilband As zeigt, das durch Umkehren der Reihenfolge der MDCT-Koeffizienten in dem niedrigeren Teilband A erhalten wird. 8D ein Diagramm, das ein Teilband Ar zeigt, das durch Umkehren der Vorzeichen der MDCT-Koeffizienten in dem niedrigeren Teilband A erhalten wird. Die MDCT-Koeffizienten in dem niedrigeren Teilband A werden beispielsweise durch (p0, p1, ..., pN) dargestellt. In diesem Fall stellt beispielsweise p0 den Wert des 0. MDCT-Koeffizienten in dem Teilband A dar. Die MDCT-Koeffizienten in dem Teilband As, die durch Umkehren der Reihenfolge der MDCT- Koeffizienten in dem Teilband A in Frequenzrichtung erhalten werden, sind (pN, p(n – 1), ..., p0). Die MDCT-Koeffizienten in dem Teilband Ar, die durch Umkehren der Vorzeichen der MDCT-Koeffizienten in dem niedrigeren Teilband A erhalten werden, werden durch (–p0, –p1, ..., –pN) dargestellt. Es wird nicht nur das Teilband A definiert, sondern es werden auch die Teilbänder B–G, die Teilbänder Bs–Gs, deren Reihenfolge umgekehrt wird, und die Teilbänder Br–Gr, deren Vorzeichen umgekehrt werden, definiert.
  • Wie vorstehend dargelegt, legt die BBE-Codiereinheit 801 bei der dritten Ausführungsform ein Teilband fest, das anstelle der entsprechenden höheren Teilbänder h0 bis h7 verwendet werden soll, das heißt, sie legt eines der sieben niedrigeren Teilbänder A–G, der sieben niedrigeren Teilbänder As–Gs oder der sieben niedrigeren Teilbänder Ar–Gr fest, die durch Umkehren der Reihenfolge oder der Vorzeichen der sieben MDCT-Koeffizienten in den niedrigeren Teilbändern A–G erhalten werden. Die BBE-Codiereinheit 801 codiert die Daten zum Darstellen der MDCT-Koeffizienten des höheren Bands unter Verwendung des festgelegten niedrigeren Teilbands und erzeugt den in 5C gezeigten Codierte-Erweiterungsaudiodaten-Strom. In diesem Fall codiert die BBE-Codiereinheit 801 für jedes höhere Teilband die Daten, die das niedrigere Teilband festlegen, das anstelle des MDCT-Koeffizienten des höheren Bands verwendet wird, die Daten, die angeben, ob die Reihenfolge der MDCT-Koeffizienten in den festgelegten niedrigeren Teilbändern umgekehrt werden soll oder nicht, und die Daten, die angeben, ob die positiven und negativen Vorzeichen der MDCT-Koeffizienten in den festgelegten niedrigeren Teilbändern umgekehrt werden sollen oder nicht, als Frequenzspektrum-Erweiterungsdaten.
  • Die Decodiervorrichtung der dritten Ausführungsform empfängt den Codierte-Erweiterungsaudiodaten-Strom, der mit der vorstehend beschriebenen Codiervorrichtung der dritten Ausführungsform codiert wird, und decodiert die Frequenzspektrum-Erweiterungsdaten, die angeben, welcher der MDCT-Koeffizienten in den niedrigeren Teilbändern A–G anstelle der höheren Teilbänder h0 bis h7 verwendet werden, ob die Reihenfolge der MDCT-Koeffizienten umgekehrt werden soll oder nicht und ob die positiven und negativen Vorzeichen der MDCT- Koeffizienten umgekehrt werden sollen oder nicht. Dann erzeugt die Decodiervorrichtung entsprechend den decodierten Frequenzspektrum-Erweiterungsdaten die MDCT-Koeffizienten in den höheren Teilbändern h0 bis h7 durch Umkehren der Reihenfolge oder der Vorzeichen der MDCT-Koeffizienten in den festgelegten Teilbändern A–G.
  • Die dritte Ausführungsform umfasst nicht nur die Erweiterung der Reihenfolge und der positiven und negativen Vorzeichen der MDCT-Koeffizienten in den niedrigeren Teilbändern, sondern auch die Ersetzung durch die gefilterten MDCT-Koeffizienten in den niedrigeren Teilbändern. Es sei darauf hingewiesen, dass das Filtern beispielsweise IIR-Filtern, FIR-Filtern usw. bedeutet, aber diese Filterverfahren werden hier nicht beschrieben, da sie Fachleuten bekannt sind. Wenn bei diesen Filterverfahren die Filterkoeffizienten in den Codierte-Erweiterungsaudiodaten-Strom aufseiten der Codiervorrichtung codiert werden, werden aufseiten der Decodiervorrichtung die MDCT-Koeffizienten in den festgelegten niedrigeren Teilbändern IIR-gefiltert oder FIR-gefiltert, was durch die decodierten Filterkoeffizienten angegeben wird, und die höheren Teilbänder können durch die gefilterten MDCT-Koeffizienten ersetzt werden. Es sei darauf hingewiesen, dass die bei der ersten Ausführungsform verwendete Verstärkungsregelung in der gleichen Weise bei der dritten Ausführungsform verwendet werden kann. Wenn die Codiervorrichtung und die Decodiervorrichtung mit dem vorstehend beschriebenen Aufbau verwendet werden, kann ein im Breitband wiedergegebener Ton unter Verwendung des Codierte-Erweiterungsaudiodaten-Stroms ohne eine große Datenmenge erhalten werden.
  • Vierte Ausführungsform
  • Die vierte Ausführungsform unterscheidet sich von der dritten Ausführungsform dadurch, dass die Decodiervorrichtung der vierten Ausführungsform nicht nur die MDCT-Koeffizienten in den festgelegten niedrigeren Teilbändern A–G anstelle der MDCT-Koeffizienten in den höheren Teilbändern h0 bis h7 verwendet, sondern die MDCT-Koeffizienten, die mit der Rauscherzeugungseinheit erzeugt werden, zusätzlich zu den MDCT-Koeffizienten in den festgelegten niedrigeren Teilbändern A–G anstelle der MDCT-Koeffizienten in den höheren Teilbändern h0 bis h7 verwendet. Daher sind die Komponenten der Decodiervorrichtung der vierten Ausführungsform, deren Aufbau von denen der Decodiervorrichtung 600 der ersten Ausführungsform abweicht, nur die Rauscherzeugungseinheit 901 und die BBE-Decodiereinheit 902. Für die Decodierung des Codierte-Erweiterungsaudiodaten-Stroms in der Decodiervorrichtung der vierten Ausführungsform wird nachstehend der Fall, dass beispielsweise das mit der BBE-Decodiereinheit zu decodierende höhere Teilband h0 durch das niedrigere Teilband A ersetzt wird, unter Bezugnahme auf die 9A–C beschrieben. 9A ist ein Diagramm, das ein Beispiel für die MDCT-Koeffizienten in dem niedrigeren Teilband A zeigt, die für das höhere Teilband h0 festgelegt werden. 9B ist ein Diagramm, das ein Beispiel für die gleiche Anzahl von MDCT-Koeffizienten wie die in dem niedrigeren Teilband A zeigt, die von der Rauscherzeugungseinheit 901 erzeugt werden. 9C ist ein Diagramm, das ein Beispiel für die MDCT-Koeffizienten zeigt, die anstelle des höheren Teilbands h0 verwendet werden und unter Verwendung der MDCT-Koeffizienten in dem in 9A gezeigten niedrigeren Teilband A und der MDCT-Koeffizienten erzeugt werden, die mit der in 9B gezeigten Rauscherzeugungseinheit 901 erzeugt werden. Hier sollen die MDCT-Koeffizienten in dem niedrigeren Teilband A A = (p0, p1, ..., pN) sein. Und die gleiche Anzahl von Rauschsignal-MDCT-Koeffizienten wie die in dem niedrigeren Teilband A, M = (n0, n1, ..., nN), wird in der Rauscherzeugungseinheit 901 erhalten. Die BBE-Decodiereinheit 902 stellt die MDCT-Koeffizienten A in dem niedrigeren Teilband A und die Rauschsignal-MDCT-Koeffizienten M unter Verwendung von Bewertungsfaktoren α, β ein und erzeugt die Ersatz-MDCT-Koeffizienten A', die anstelle der MDCT-Koeffizienten in dem höheren Teilband h0 verwendet werden. Die Ersatz-MDCT-Koeffizienten A' werden durch den folgenden Ausdruck 6 dargestellt: A' = α(p0, p1, ..., pN) + β(n0, n1, ..., nN) (Ausdruck 6).
  • Die Bewertungsfaktoren α, β können vorgegebene Werte in der Decodiervorrichtung der vierten Ausführungsform sein oder können Werte sein, die dadurch erhalten werden, dass die Steuerdaten, die die Werte der Bewertungsfaktoren α, β angeben, in den Codierte-Erweiterungsaudiodaten-Strom in der Codiervorrichtung codiert werden und diese Werte in der Decodiervorrichtung decodiert werden.
  • Hier ist das von der BBE-Decodiereinheit 902 ausgegebene Teilband h0 als Beispiel erläutert worden, aber die gleiche Verarbeitung wird auch für die anderen höheren Teilbänder h1 bis h7 ausgeführt. Außerdem ist das niedrigere Teilband A als Beispiel für ein niedrigeres Teilband, das anstelle eines höheren Teilbands verwendet wird, beschrieben worden, aber es können auch alle anderen niedrigeren Teilbänder, die mit der Dequantisierungseinheit erhalten werden, verwendet werden, und die Verarbeitung für sie ist die Gleiche. Bei den Bewertungsfaktoren α, β kann der eine den Wert „0" und der andere den Wert „1" haben, oder ihre Werte können so sein, dass α, β = 1 ist. Wenn α = 0 ist, wird das Verhältnis der Energie der MDCT-Koeffizienten in den höheren Teilbändern zu der Energie der MDCT-Koeffizienten der Rauschdaten berechnet, und das erhaltene Energie-Verhältnis wird als Verstärkungsdaten für die MDCT-Koeffizienten der Rausch-Informationen in den Codierte-Erweiterungsaudiodaten-Strom codiert. Außerdem kann ein Wert codiert werden, der das Verhältnis zwischen den Bewertungsfaktoren α und β darstellt. Und wenn alle MDCT-Koeffizienten in einem niedrigeren Teilband, das von der BBE-Decodiereinheit 902 kopiert wird, „0" sind, kann die Steuerung so durchgeführt werden, dass unabhängig von dem Wert von α der Wert von β auf „1" eingestellt wird. Die Rauscherzeugungseinheit 901 kann so gestaltet sein, dass sie eine erstellte Tabelle hält und Werte in der Tabelle als Rauschsignal-MDCT-Koeffizienten ausgibt oder dass sie Rauschsignal-MDCT-Koeffizienten erzeugt, die durch die MDCT des Rauschsignals im Zeitbereich für jedes Frame erhalten werden, oder die Verstärkungsregelung der Rauschsignale im Zeitbereich durchführt und die Rauschsignal-MDCT-Koeffizienten unter Verwendung aller oder einiger MDCT-Koeffizienten ausgibt, die durch die MDCT des verstärkungsgeregelten Rauschsignals erhalten werden.
  • Insbesondere wenn die MDCT-Koeffizienten verwendet werden, die durch Verstärkungsregelung des Rauschsignals im Zeitbereich und durch Durchführen der MDCT an dem Rauschsignal erhalten werden, ist der Effekt des Unterdrückens des Vorechos des wiedergegebenen Tons zu erwarten. In diesem Fall werden die Verstärkungsregelungsdaten zum Regeln der Verstärkung des Rauschsignals im Zeitbereich vorher mit der Codiervorrichtung der vierten Ausführungsform codiert, und die Decodiervorrichtung kann die Verstärkungsregelungsdaten decodieren und verwenden. Wenn die wie vorstehend gestaltete Decodiervorrichtung verwendet wird, ist der Effekt der Realisierung der Breitband-Wiedergabe zu erwarten, ohne dass die Tonalität durch die Verwendung der Rauschsignal-MDCT-Koeffizienten extrem erhöht wird, auch wenn die MDCT-Koeffizienten der niedrigeren Teilbänder die MDCT-Koeffizienten in den höheren Teilbändern, die BBE-decodiert werden sollen, nicht ausreichend darstellen können.
  • Fünfte Ausführungsform
  • Die fünfte Ausführungsform unterscheidet sich von der vierten Ausführungsform dadurch, dass die Funktionen so erweitert werden, dass mehrere Zeitrahmen als eine Einheit gesteuert werden können. Nachstehend werden die Operationen einer BBE-Codiereinheit 1001 und einer BBE-Decodiereinheit 1002 in der Codiervorrichtung und der Decodiervorrichtung der fünften Ausführungsform unter Bezugnahme auf die 10A–C und die 11A–C erläutert. 10A ist ein Diagramm, das MDCT-Koeffizienten in einem Frame zum Zeitpunkt t0 zeigt. 10B ist ein Diagramm, das MDCT-Koeffizienten im nächsten Frame zum Zeitpunkt t1 zeigt. 10C ist ein Diagramm, das MDCT-Koeffizienten im übernächsten Frame zum Zeitpunkt t2 zeigt. Die Zeitpunkte t0, t1 und t2 sind zusammenhängende Zeitpunkte und sie sind die Zeitpunkte, die mit den Frames synchronisiert sind. Bei der ersten bis vierten Ausführungsform werden die Codierte-Erweiterungsaudiodaten-Ströme zu den Zeitpunkten t0, t1 bzw. t2 erzeugt, während die Codiervorrichtung der fünften Ausführungsform einen Codierte-Erweiterungsaudiodaten-Strom erzeugt, den mehrere zusammenhängende Frames gemeinsam haben. In diesen Figuren sind zwar drei zusammenhängende Frames dargestellt, aber es kann jede Anzahl von zusammenhängenden Frames verwendet werden. In 5C der ersten Ausführungsform hat das obere Ende des Codierte-Erweiterungsaudiodaten-Stroms ein Datenelement, das angibt, ob die niedrigeren Teilbänder A–D, die in der gleichen Weise wie der Codierte-Erweiterungsaudiodaten-Strom im letzten Frame geteilt werden, verwendet werden oder nicht. Die BBE-Codiereinheit 1001 der fünften Ausführungsform stellt in der gleichen Weise ein Datenelement bereit, das angibt, ob der Codierte-Erweiterungsaudiodaten-Strom, der der Gleiche wie im letzten Frame ist, am oberen Ende des Codierte-Erweiterungsaudiodaten-Stroms in jedem Frame verwendet wird oder nicht. Nachstehend wird der Fall beschrieben, dass die höheren Teilbänder in jedem Frame zu den Zeitpunkten t0, t1 und t2 unter Verwendung des Codierte-Erweiterungsaudiodaten-Stroms in dem Frame beispielsweise zum Zeitpunkt t0 decodiert werden.
  • Die Decodiervorrichtung der fünften Ausführungsform empfängt den Codierte-Erweiterungsaudiodaten-Strom, der zur gemeinsamen Verwendung mehrerer zusammenhängender Frames erzeugt wird, und führt eine BBE-Decodierung jedes Frames durch. Wenn beispielsweise das höhere Teilband h0 in dem Frame zum Zeitpunkt t0 durch das niedrigere Teilband C in dem Frame zum gleichen Zeitpunkt t0 ersetzt wird, decodiert die BBE-Decodiereinheit 1002 auch das höhere Teilband h0 in dem Frame zum Zeitpunkt t1 unter Verwendung des niedrigeren Teilbands C zum Zeitpunkt t1 und decodiert außerdem in der gleichen Weise das höhere Teilband h0 in dem Frame zum Zeitpunkt t2 unter Verwendung des niedrigeren Teilbands C zum Zeitpunkt t2. Die BBE-Decodiereinheit 1002 führt die gleiche Verarbeitung auch für die anderen höheren Teilbänder h1 bis h7 durch. Wenn die Codiervorrichtung und die Decodiervorrichtung mit dem vorstehenden Aufbau verwendet werden, können die Bereiche des codierten Audio-Bitstroms, die von dem Codierte-Erweiterungsaudiodaten-Strom eingenommen werden, für mehrere Frames, die denselben Codierte-Erweiterungsaudiodaten-Strom verwenden, insgesamt verringert werden, und dadurch können eine effizientere Codierung und Decodierung realisiert werden.
  • Nachstehend wird ein weiteres Beispiel für die Codiervorrichtung und Decodiervorrichtung der fünften Ausführungsform unter Bezugnahme auf die 11A–C erläutert. Dieses Beispiel unterscheidet sich von dem vorstehenden Beispiel dadurch, dass die BBE-Codiereinheit 1101 die Verstärkungsdaten zur Durchführung der Verstärkungsregelung für jedes Frame mit einer anderen Verstärkung in den MDCT-Koeffizienten des höheren Bands codiert, die unter Verwendung desselben Codierte-Erweiterungsaudiodaten-Stroms für mehrere zusammenhängende Frames decodiert werden. Die 11A–C sind wie die 10A–C Diagramme, die MDCT-Koeffizienten in mehreren zusammenhängenden Frames zu den Zeitpunkten t0, t1 und t2 zeigen. Die andere Codiervorrichtung der fünften Ausführungsform erzeugt Relativwerte der Verstärkungen der MDCT-Koeffizienten des höheren Bands, die in mehreren Frames in den Codierte-Erweiterungsaudiodaten-Strom BBE-decodiert werden. Beispielsweise sind die mittleren Amplituden der zu BBE-decodierenden MDCT-Koeffizienten in der Bandbreite (das höhere Frequenzband von der Max.-Linie bits zu Ziellinie) G0, G1 und G2 für die Frames zu den Zeitpunkten t0, t1 und t2.
  • Zunächst wird das Referenz-Frame von den Frames zu den Zeitpunkten t0, t1 und t2 bestimmt. Es kann das erste Frame zum Zeitpunkt t0 oder das Frame, das die größte mittlere Amplitude ergibt, als Referenz-Frame festgelegt werden, und die Daten, die die Position des Frames angeben, das die größte mittlere Amplitude ergibt, können getrennt in den Codierte-Erweiterungsaudiodaten-Strom codiert werden. Hier wird angenommen, dass die mittlere Amplitude G0 in dem Frame zum Zeitpunkt t0 die größte mittlere Amplitude in den zusammenhängenden Frames ist, in denen die MDCT-Koeftizienten des höheren Bands unter Verwendung desselben Codierte-Erweiterungsaudiodaten-Stroms decodiert werden. In diesem Fall wird die mittlere Amplitude in dem höheren Frequenzband in dem Frame zum Zeitpunkt t1 durch G1/G0 für das Referenz-Frame zum Zeitpunkt t0 dargeste lt, und die mittlere Amplitude in dem höheren Frequenzband in dem Frame zum Zeitpunkt t2 wird durch G2/G0 für das Referenz-Frame zum Zeitpunkt t0 dargestellt. Die BBE-Codiereinheit 1101 quantisiert die Relativwerte G1/G0 und G2/G0 dieser mittleren Amplituden in dem höheren Frequenzband, um sie in den Codierte-Erweiterungsaudiodaten-Strom zu codieren.
  • In der anderen Decodiervorrichtung der fünften Ausführungsform empfängt die BBE-Codiereinheit 1102 den Codierte-Erweiterungsaudiodaten-Strom, legt ein Referenz-Frame aus dem Codierte-Erweiterungsaudiodaten-Strom fest, um es zu decodieren, oder decodiert ein vorgegebenes Frame und decodiert den Wert der mittleren Amplitude des Referenz-Frames. Außerdem decodiert die BBE-Decodiereinheit 1102 den Wert der mittleren Amplitude in Bezug auf das Referenz-Frame der zu BBE-decodierenden MDCT-Koeffizienten des höheren Bands und führt eine Verstärkungsregelung an den MDCT-Koeffizienten des höheren Bands in jedem Frame aus, die entsprechend dem gemeinsamen Codierte-Erweiterungsaudiodaten-Strom decodiert werden. Wie vorstehend dargelegt, können mit der in den 11A–C gezeigten BBE-Decodiereinheit 1102 die mittleren Amplituden der MDCT-Koeffizienten, die unter Verwendung des gemeinsamen Codierte-Erweiterungsaudiodaten-Stroms decodiert werden, in mehreren Frames problemlos korrigiert werden. Dadurch kann der codierte Audiodatenstrom, der mit Wiedergabetreue zum Originalton als Breitband-Audiosignal wiedergegeben werden kann, mit einer kleinen Datenmenge codiert und decodiert werden.
  • Sechste Ausführungsform
  • Die sechste Ausführungsform unterscheidet sich von der fünften Ausführungsform dadurch, dass die Codiervorrichtung und die Decodiervorrichtung der fünften Ausführungsform ein Audiosignal im Zeitbereich in ein Zeit-Frequenz-Signal, das die zeitliche Änderung des Frequenzspektrums darstellt, transformieren und invers transformieren. Jeweils 32 zusammenhängende Abtastwerte von 1024 Abtastwerten für ein Frame eines Audiosignals, das beispielsweise mit einer Abtastfrequenz von 44,1 kHz abgetastet wird, werden alle etwa 0,73 ms frequenztransformiert, und es werden Frequenzspektren erhalten, die jeweils aus 32 Abtastwerten bestehen. Es werden 32 Frequenzspektren erhalten, die eine Zeitdifferenz von etwa 0,73 ms für jedes Frame mit 1024 Abtastwerten haben. Diese Frequenzspektren stellen jeweils die Wiedergabe-Bandbreite von 0 kHz bis maximal 22,05 kHz für 32 Abtastwerte dar. Die Wellenform, die durch Kombinieren der Werte der Spektrumsdaten mit der gleichen Frequenz in der Zeitrichtung aus diesen Frequenzspektren erhalten wird, ist ein Zeit-Frequenz-Signal, das von dem QMF-Filter ausgegeben wird. Die Codiervorrichtung der vorliegenden Erfindung führt eine Quantisierung und Codierung mit variabler Länge beispielsweise des 0. bis 15. Zeit-Frequenz-Signals der Zeit-Frequenz-Signale, die von dem QMF-Filter ausgegeben werden, in der gleichen Weise wie die herkömmliche Codiervorrichtung durch. Für das 16. bis 31. Zeit-Frequenz-Signal des höheren Bands legt die Codiervorrichtung jedoch ein Zeit-Frequenz-Signal des 0. bis 15. Zeit-Frequenz-Signals fest, das anstelle des 16. bis 31. Signals verwendet werden soll, und erzeugt erweiterte Zeit-Frequenz-Signale, die Daten enthalten, die das festgelegte Signal des 0. bis 15. Zeit-Frequenz-Signals des niedrigeren Bands angeben, und Verstärkungsdaten zum Einstellen der Amplitude des festgelegten Zeit-Frequenz-Signals des niedrigeren Bands. Wenn das Filtern durchgeführt wird oder ein Filter mit einer anderen Kennlinie, die von einem Parameter abhängt, verwendet wird, wird vorher ein Parameter zum Festlegen der Einzelheiten der Verarbeitung oder die Kennlinie des Filters in den erweiterten Zeit-Frequenz-Signalen angegeben. Dann legt die Codiervorrichtung den codierten Audiodatenstrom des niedrigeren Bands, der durch Quantisierung und Codierung mit variabler Länge der Zeit-Frequenz-Signale des niedrigeren Bands erhalten wird, und den codierten Audiodatenstrom des höheren Bands, der durch Codierung mit variabler Länge der erweiterten Zeit-Frequenz-Signale in dem codierten Audio-Bitstrom erhalten wird, fest, um sie auszugeben.
  • 12 ist ein Blockdiagramm, das den Aufbau einer Decodiervorrichtung 1200 zeigt, die Breitband-Zeit-Frequenz-Signale aus einem codierten Audio-Bitstrom decodiert, der unter Verwendung eines QMF-Filters codiert wird. Die Decodiervorrichtung 1200 ist eine Decodiervorrichtung, die Breitband-Zeit-Frequenz-Signale aus dem eingegebenen codierten Audio-Bitstrom decodiert, der aus dem codierten Datenstrom, der durch Codierung mit variabler Länge der erweiterten Zeit-Frequenz-Signale erhalten wird, die die Zeit-Frequenz-Signale des höheren Bands darstellen, und dem codierten Datenstrom, der durch Quantisierung und Codierung der Zeit-Frequenz-Signale des niedrigeren Bands erhalten wird, besteht. Die Decodiervorrichtung 1200 weist eine Kern-Decodiereinheit 1201, eine erweiterte Decodiereinheit 1202 und eine Spektrum-Addiereinheit 1203 auf. Die Kern-Decodiereinheit 1201 decodiert den eingegebenen codierten Audio-Bitstrom und teilt ihn in die quantisierten Zeit-Frequenz-Signale des niedrigeren Bands und die erweiterten Zeit-Frequenz-Signale, die die Zeit-Frequenz-Signale des höheren Bands darstellen. Die Kern-Decodiereinheit 1201 dequantisiert außerdem die von dem codierten Audio-Bitstrom abgetrennten Zeit-Frequenz-Signale des niedrigeren Bands und gibt sie an die Spektrum-Addiereinheit 1203 aus. Die Spektrum-Addiereinheit 1203 addiert die von der Kern-Decodiereinheit 1201 decodierten und dequantisierten Zeit-Frequenz-Signale und die von der Kern-Decodiereinheit 1202 (Anm. d. Übers.: muss wohl „1201" heißen) erzeugten Zeit-Frequenz-Signale des höheren Bands und gibt die Zeit-Frequenz-Signale in dem gesamten Wiedergabeband von beispielsweise 0 kHz bis 22,05 kHz aus. Diese ausgegebenen Zeit-Frequenz-Signale werden beispielsweise mit einem Inverstransformations-QMF-Filter, das später beschrieben wird, aber nicht dargestellt ist, in Audiosignale im Zeitbereich transformiert und weiter in hörbaren Ton, wie etwa Sprache und Musik, mit einem später beschriebenen Lautsprecher umgewandelt.
  • Die erweiterte Decodiereinheit 1202 ist eine Verarbeitungseinheit, die die von der Kern-Decodiereinheit 1201 decodierten Zeit-Frequenz-Signale des niedrigeren Bands und die erweiterten Zeit-Frequenz-Signale empfängt, aufgrund der abgetrennten erweiterten Zeit-Frequenz-Signale die Zeit-Frequenz-Signale des niedrigeren Bands festlegt, die anstelle der Zeit-Frequenz-Signale des höheren Bands verwendet werden, um sie in das höhere Frequenzband zu kopieren, und ihre Amplituden einstellt, um die Zeit-Frequenz-Signale des höheren Bands zu erzeugen. Die erweiterte Decodiereinheit 1202 weist weiterhin eine Ersetzungssteuereinheit 1204 und eine Verstärkungseinstelleinheit 1205 auf. Die Ersetzungssteuereinheit 1204 legt beispielsweise ein Zeit-Frequenz-Signal des 0. bis 15. Zeit-Frequenz-Signals des niedrigeren Bands, das anstelle des 16. Zeit-Frequenz-Signals des höheren Bands verwendet wird, entsprechend den decodierten erweiterten Zeit-Frequenz-Signalen fest und kopiert das festgelegte Zeit-Frequenz-Signal des niedrigeren Bands als 16. Zeit-Frequenz-Signal des höheren Bands. Die Verstärkungseinstelleinheit 1205 verstärkt das als 16. Zeit-Frequenz-Signal des höheren Bands kopierte Zeit-Frequenz-Signal des niedrigeren Bands entsprechend den in dem erweiterten Zeit-Frequenz-Signal angegebenen Verstärkungsdaten und stellt die Amplitude ein. Die erweiterte Decodiereinheit 1202 führt die vorstehende Verarbeitung mit der Ersetzungssteuereinheit 1204 und der Verstärkungseinstelleinheit 1205 für jedes Zeit-Frequenz-Signal des 17. bis 31. Zeit-Frequenz-Signals des höheren Bands durch. Wenn 4 Bit zum Festlegen eines Zeit-Frequenz-Signals des 0. bis 15. Zeit-Frequenz-Signals des niedrigeren Bands und 4 Bit für die Verstärkungsdaten zum Einstellen der Amplitude des kopierten Zeit-Frequenz-Signals des niedrigeren Bands verwendet werden, kann das 16. bis 31. Zeit-Frequenz-Signal des höheren Bands mit maximal (4 + 4) × 32 = 256 Bit dargestellt werden.
  • 13 ist ein Diagramm, das ein Beispiel für die Zeit-Frequenz-Signale zeigt, die von der Decodiervorrichtung 1200 der sechsten Ausführungsform decodiert werden. Wenn das Spektrum des k-ten Zeit-Frequenz-Signals des niedrigeren Bands beispielsweise durch Bk = pk(t0), pk(t1), ..., pk(t31) dargestellt wird, wobei k eine Ganzzahl von 0 ≤ k ≤ 15 ist, werden, wie in 13 gezeigt, das quantisierte und decodierte 0. bis 15. Zeit-Frequenz-Signal B0 bis B15 des niedrigeren Bands in dem codierten Audio-Bitstrom dargestellt, der von der in der Figur nicht dargestellten Codiervorrichtung der sechsten Ausführungsform erzeugt wird. Für das 16. bis 31. Zeit-Frequenz-Signal B16 bis B31 des höheren Bands werden hingegen die Daten, die ein Zeit-Frequenz-Signal des 0. bis 15. Zeit-Frequenz-Signals B0 bis B15 des niedrigeren Bands festlegen, die jeweils anstelle des 16. bis 31. Zeit-Frequenz-Signals des höheren Bands verwendet werden, und die Verstärkungsdaten zum Einstellen der Amplituden der einzelnen Zeit-Frequenz-Signale des niedrigeren Bands, die in das höhere Frequenzband kopiert werden, angegeben. Um beispielsweise das 16. Zeit-Frequenz-Signal B16 des höheren Bands darzustellen, werden die Daten, die das 10. Zeit-Frequenz-Signal B10 des niedrigeren Bands angeben, das anstelle des 16. Zeit-Frequenz-Signals B16 des höheren Bands verwendet wird, und die Verstärkungsdaten G0 zum Einstellen der Amplitude des Zeit-Frequenz-Signals B10 des niedrigeren Bands, das als 16. Zeit-Frequenz-Signal B16 des höheren Bands in das höhere Frequenzband kopiert wird, in dem erweiterten Zeit-Frequenz-Signal angegeben. Dadurch wird das von der Kern-Decodiereinheit 1201 decodierte und dequantisierte 10. Zeit-Frequenz-Signal B10 des niedrigeren Bands als 16. Zeit-Frequenz-Signal B16 des höheren Bands in das höhere Frequenzband kopiert und mit der in den Verstärkungsdaten G0 angegebenen Verstärkung verstärkt, und dann wird das 16. Zeit-Frequenz-Signal B16 des höheren Bands erzeugt. Die gleiche Verarbeitung wird für das 17. Zeit-Frequenz-Signal B17 des höheren Bands durchgeführt. Das in dem erweiterten Zeit-Frequenz-Signal angegebene 11. Zeit-Frequenz-Signal B11 des niedrigeren Bands wird von der Ersetzungssteuereinheit 1204 als 17. Zeit-Frequenz-Signal B17 des höheren Bands kopiert und mit der in den Verstärkungsdaten G1 angegebenen Verstärkung verstärkt, und das 17. Zeit-Frequenz-Signal B17 des höheren Bands wird erzeugt. Diese Verarbeitung wird für das 18. bis 31. Zeit-Frequenz-Signal des höheren Bands wiederholt, und dadurch können alle Zeit-Frequenz-Signale des höheren Bands erhalten werden.
  • Wie vorstehend dargelegt, kann bei der sechsten Ausführungsform die Codiervorrichtung Breitband-Audio-Zeit-Frequenz-Signale mit einer relativ kleinen höheren Datenmenge durch Verwendung der erfindungsgemäßen Ersetzung codieren, das heißt, die Ersetzung der Zeit-Frequenz-Signale des höheren Bands durch die Zeit-Frequenz-Signale des niedrigeren Bands, sodass die Zeit-Frequenz-Signale entstehen, die die Ausgangssignale von dem QMF-Filter sind, während die Decodiervorrichtung Audiosignale decodieren kann, die als satter Ton im höheren Frequenzband wiedergegeben werden können.
  • Bei der sechsten Ausführungsform ist dargelegt worden, dass die einzelnen Zeit-Frequenz-Signale des niedrigeren Bands anstelle der einzelnen Zeit-Frequenz-Signale des höheren Bands verwendet werden, aber die vorliegende Erfindung ist nicht darauf beschränkt.
  • Sie kann so gestaltet werden, dass das niedrigere Frequenzband und das höhere Frequenzband in mehrere Gruppen (beispielsweise acht) unterteilt werden, die jeweils aus der gleichen Anzahl (beispielsweise vier) von Zeit-Frequenz-Signalen bestehen, und dadurch werden die Zeit-Frequenz-Signale in einer der Gruppen in dem niedrigeren Band anstelle der einzelnen Gruppen in dem höheren Frequenzband verwendet. Außerdem kann die Amplitude der Zeit-Frequenz-Signale des niedrigeren Bands, die in das höhere Frequenzband kopiert werden, durch Addieren des erzeugten Rauschens, das aus 32 Spektralwerten besteht, eingestellt werden. Bei der sechsten Ausführungsform wird von der Voraussetzung ausgegangen, dass die Abtastfrequenz 44,1 kHz beträgt, ein Frame aus 1024 Abtastwerten besteht, die Anzahl der in einem Zeit-Frequenz-Signal enthaltenen Abtastwerte 22 beträgt und die Anzahl der in einem Frame enthaltenen Zeit-Frequenz-Signale 32 beträgt, aber die vorliegende Erfindung ist nicht darauf beschränkt. Die Abtastfrequenz und die Anzahl der in einem Frame enthaltenen Abtastwerte können auch andere Werfe sein.
  • Anwendunpsmöglichkeiten in der Industrie
  • Die erfindungsgemäße Codiervorrichtung ist als Audio-Codiervorrichtung, die in einer Satellitenrundfunkstation mit einer Basisstation und einem Kommunikationssystem angeordnet ist, als Audio-Codiervorrichtung für einen Inhaltsverteilungsserver, der Inhalte über ein Kommunikationsnetz, wie etwa das Internet, verteilt, und für Programme zum Codieren von Audiosignalen, die auf einem Universalrechner ausgeführt werden, geeignet.
  • Die erfindungsgemäße Decodiervorrichtung ist nicht nur als Audio-Decodiervorrichtung, die in einer Set-Top-Box für den Heimgebrauch enthalten ist, sondern auch als Programm zum Decodieren von Audiosignalen, das von einem Universalrechner, einer Leiterplatte oder einem LSI nur zum Decodieren von in einer Set-Top-Box oder einem Universalrechner enthaltenen Audiosignalen und einer in eine Set-Top-Box oder einen Universalrechner eingesteckten IC-Karte ausgeführt wird, geeignet.

Claims (29)

  1. Codiervorrichtung, die ein Eingangssignal codiert, mit: einer Zeit-Frequenz-Transformationseinheit, die so betreibbar ist, dass sie ein Eingangssignal in einem Zeitbereich in ein Frequenzspektrum mit einem niedrigeren Frequenzspektrum transformiert; einer Banderweiterungseinheit, die so betreibbar ist, dass sie Erweiterungsdaten erzeugt, die zum Festlegen eines höheren Frequenzspektrums mit einer höheren Frequenz als das niedrigere Frequenzspektrum verwendet werden; und einer Codiereinheit, die so betreibbar ist, dass sie das niedrigere Frequenzspektrum und die Erweiterungsdaten codiert und das codierte niedrigere Frequenzspektrum und die codierten Erweiterungsdaten ausgibt, dadurch gekennzeichnet, dass die Banderweiterungseinheit einen ersten Parameter und einen zweiten Parameter als Erweiterungsdaten erzeugt, wobei der erste Parameter zum Bestimmen eines Teilspektrums, das als das höhere Frequenzspektrum einer Vielzahl der das niedrigere Frequenzspektrum bildenden Teilspektren kopiert werden soll, verwendet wird und der zweite Parameter zum Bestimmen einer Verstärkung des Teilspektrums nach dem Kopieren verwendet wird, und die Banderweiterungseinheit einen dritten Parameter erzeugt, der zum Bestimmen einer Frequenzposition eines Teilspektrums mit der niedrigsten Frequenzkomponente von zum Erzeugen der Erweiterungsdaten dienenden Teilspektren von einer Vielzahl der das niedrigere Frequenzspektrum bildenden Teilspektren verwendet wird.
  2. Codiervorrichtung nach Anspruch 1, dadurch gekennzeichnet, dass die Zeit-Frequenz-Transformationseinheit so betreibbar ist, dass sie eine MDCT-Transformation (MDCT: modifizierte diskrete Kosinus-Transformation) eines Eingangssignals in einem Zeitbereich in ein Frequenzspektrum mit einem niedrigeren Frequenzspektrum durchführt.
  3. Codiervorrichtung nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Banderweiterungseinheit weiterhin einen Parameter, der die Energie eines Rauschspektrums festlegt, das zu dem höheren Frequenzspektrum addiert wird, das durch den ersten Parameter, den zweiten Parameter und den dritten Parameter festgelegt wird, als Erweiterungsdaten erzeugt.
  4. Codiervorrichtung nach Anspruch 3, dadurch gekennzeichnet, dass der Parameter, der die Energie eines Rauschspektrums festlegt, ein Energie-Anteil des Rauschspektrums an dem höheren Frequenzspektrum ist.
  5. Codiervorrichtung nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass der erste Parameter Informationen enthält, die angeben, ob dieselben Erweiterungsinformationen wie die eines vorhergehenden Frames verwendet werden sollen oder nicht.
  6. Codiervorrichtung nach Anspruch 5, dadurch gekennzeichnet, dass der erste Parameter Informationen enthält, die angeben, ob dieselben Erweiterungsinformationen wie die eines unmittelbar vorhergehenden Frames verwendet werden sollen oder nicht.
  7. Codierverfahren zum Codieren eines Eingangssignals, das folgende Schritte aufweist: einen Zeit-Frequenz-Transformationsschritt zum Transformieren eines Eingangssignals in einem Zeitbereich in ein Frequenzspektrum mit einem niedrigeren Frequenzspektrum; einen Banderweiterungsschritt zum Erzeugen von Erweiterungsdaten, die zum Festlegen eines höheren Frequenzspektrums mit einer höheren Frequenz als das niedrigere Frequenzspektrum verwendet werden; und einen Codierschritt zum Codieren des niedrigeren Frequenzspektrums und der Erweiterungsdaten und zum Ausgeben des codierten niedrigeren Frequenzspektrums und der codierten Erweiterungsdaten, dadurch gekennzeichnet, dass der Banderweiterungsschritt einen ersten Parameter und einen zweiten Parameter als Erweiterungsdaten erzeugt, wobei der erste Parameter zum Bestimmen eines Teilspektrums, das als das höhere Frequenzspektrum einer Vielzahl der das niedrigere Frequenzspektrum bildenden Teilspektren kopiert werden soll, verwendet wird und der zweite Parameter zum Bestimmen einer Verstärkung des Teilspektrums nach dem Kopieren verwendet wird, und der Banderweiterungsschritt einen dritten Parameter erzeugt, der zum Bestimmen einer Frequenzposition eines Teilspektrums mit der niedrigsten Frequenzkomponente von zum Erzeugen der Erweiterungsdaten dienenden Teilspektren von einer Vielzahl der das niedrigere Frequenzspektrum bildenden Teilspektren verwendet wird.
  8. Codierverfahren nach Anspruch 7, dadurch gekennzeichnet, dass der Zeit-Frequenz-Transformationsschritt eine MDCT-Transformation eines Eingangssignals in einem Zeitbereich in ein Frequenzspektrum mit einem niedrigeren Frequenzspektrum durchführt.
  9. Codierverfahren nach Anspruch 7 oder 8, dadurch gekennzeichnet, dass der Banderweiterungsschritt weiterhin einen Parameter, der die Energie eines Rauschspektrums festlegt, das zu dem höheren Frequenzspektrum addiert wird, das durch den ersten Parameter, den zweiten Parameter und den dritten Parameter festgelegt wird, als Erweiterungsdaten erzeugt.
  10. Codierverfahren nach Anspruch 9, dadurch gekennzeichnet, dass der Parameter, der die Energie eines Rauschspektrums festlegt, ein Energie-Anteil des Rauschspektrums an dem höheren Frequenzspektrum ist.
  11. Codierverfahren nach einem der Ansprüche 7 bis 10, dadurch gekennzeichnet, dass der erste Parameter Informationen enthält, die angeben, ob dieselben Erweiterungsinformationen wie die eines vorhergehenden Frames verwendet werden sollen oder nicht.
  12. Codierverfahren nach Anspruch 11, dadurch gekennzeichnet, dass der erste Parameter Informationen enthält, die angeben, ob dieselben Erweiterungsinformationen wie die eines unmittelbar vorhergehenden Frames verwendet werden sollen oder nicht.
  13. Codierprogramm zum Codieren eines Eingangssignals, wobei das Programm einen Computer veranlasst, das Codierverfahren nach einem der Ansprüche 7 bis 12 abzuarbeiten.
  14. Maschinenlesbares Aufzeichnungsmedium, das das Codierprogramm nach Anspruch 13 aufzeichnet.
  15. Decodiervorrichtung zum Decodieren eines codierten Signals, die Folgendes aufweist: eine Decodiereinheit, die so betreibbar ist, dass sie das codierte Signal decodiert und daraus ein niedrigeres Frequenzspektrum und Erweiterungsdaten erzeugt, die zum Festlegen eines höheren Frequenzspektrums mit einer höheren Frequenz als das niedrigere Frequenzspektrum verwendet werden, wobei die Erweiterungsdaten einen ersten Parameter, einen zweiten Parameter und einen dritten Parameter aufweisen, wobei der erste Parameter zum Bestimmen eines Teilspektrums, das als das höhere Frequenzspektrum einer Vielzahl der das niedrigere Frequenzspektrum bildenden Teilspektren kopiert werden soll, verwendet wird, der zweite Parameter zum Bestimmen einer Verstärkung des Teilspektrums nach dem Kopieren verwendet wird und der dritte Parameter zum Bestimmen einer Frequenzposition eines Teilspektrums mit der niedrigsten Frequenzkomponente von zum Erzeugen der Erweiterungsdaten dienenden Teilspektren von einer Vielzahl der das niedrigere Frequenzspektrum bildenden Teilspektren verwendet wird; eine Höheres-Frequenzspektrum-Erzeugungseinheit, die so betreibbar ist, dass sie aufgrund des niedrigeren Frequenzspektrums und der Erweiterungsdaten das höhere Frequenzspektrum erzeugt; und eine Zeit-Frequenz-Transformationseinheit, die so betreibbar ist, dass sie ein Frequenzspektrum, das durch Kombinieren des erzeugten höheren Frequenzspektrums mit dem niedrigeren Frequenzspektrum erhalten wird, in ein Signal in einem Zeitbereich transformiert.
  16. Decodiervorrichtung nach Anspruch 15, dadurch gekennzeichnet, dass die Zeit-Frequenz-Transformationseinheit so betreibbar ist, dass sie eine MDCT-Transformation des durch Kombinieren des erzeugten höheren Frequenzspektrums mit dem niedrigeren Frequenzspektrum erhaltenen Frequenzspektrums in ein Signal in einem Zeitbereich durchführt.
  17. Decodiervorrichtung nach Anspruch 15 oder 16, dadurch gekennzeichnet, dass die Erweiterungsdaten weiterhin einen Parameter aufweisen, der die Energie eines Rauschspektrums festlegt, das zu dem höheren Frequenzspektrum addiert wird, das durch den ersten Parameter, den zweiten Parameter und den dritten Parameter festgelegt wird, und die Höheres-Frequenzspektrum-Erzeugungseinheit ein Rauschspektrum mit einer Energie, die von dem Parameter festgelegt wird, der die Energie eines Rauschspektrums festlegt, zu dem erzeugten höheren Frequenzspektrum addiert.
  18. Decodiervorrichtung nach Anspruch 17, dadurch gekennzeichnet, dass der Parameter, der die Energie eines Rauschspektrums festlegt, ein Energie-Anteil des Rauschspektrums an dem höheren Frequenzspektrum ist.
  19. Decodiervorrichtung nach einem der Ansprüche 15 bis 18, dadurch gekennzeichnet, dass der erste Parameter Informationen enthält, die angeben, ob dieselben Erweiterungsinformationen wie die eines vorhergehenden Frames verwendet werden sollen oder nicht, und die Höheres-Frequenzspektrum-Erzeugungseinheit das höhere Frequenzspektrum unter Verwendung der Informationen erzeugt.
  20. Decodiervorrichtung nach Anspruch 19, dadurch gekennzeichnet, dass der erste Parameter Informationen enthält, die angeben, ob dieselben Erweiterungsinformationen wie die eines unmittelbar vorhergehenden Frames verwendet werden sollen oder nicht.
  21. Decodierverfahren zum Decodieren eines Eingangssignals, das folgende Schritte aufweist: einen Decodierschritt zum Decodieren des codierten Signals, um daraus ein niedrigeres Frequenzspektrum und Erweiterungsdaten zu erzeugen, die zum Festlegen eines höheren Frequenzspektrums mit einer höheren Frequenz als das niedrigere Frequenzspektrum verwendet werden, wobei die Erweiterungsdaten einen ersten Parameter, einen zweiten Parameter und einen dritten Parameter aufweisen, wobei der erste Parameter zum Bestimmen eines Teilspektrums, das als das höhere Frequenzspektrum einer Vielzahl der das niedrigere Frequenzspektrum bildenden Teilspektren kopiert werden soll, verwendet wird, der zweite Parameter zum Bestimmen einer Verstärkung des Teilspektrums nach dem Kopieren verwendet wird und der dritte Parameter zum Bestimmen einer Frequenzposition eines Teilspektrums mit der niedrigsten Frequenzkomponente von zum Erzeugen der Erweiterungsdaten dienenden Teilspektren von einer Vielzahl der das niedrigere Frequenzspektrum bildenden Teilspektren verwendet wird; einen Höheres-Frequenzspektrum-Erzeugungsschritt zum Erzeugen des höheren Frequenzspektrums aufgrund des niedrigeren Frequenzspektrums und der Erweiterungsdaten und einen Zeit-Frequenz-Transformationsschritt zum Transformieren eines Frequenzspektrums, das durch Kombinieren des erzeugten höheren Frequenzspektrums mit dem niedrigeren Frequenzspektrum erhalten wird, in ein Signal in einem Zeitbereich.
  22. Decodierverfahren nach Anspruch 21, dadurch gekennzeichnet, dass die Zeit-Frequenz-Transformationseinheit so betreibbar ist, dass sie eine MDCT-Transformation des durch Kombinieren des erzeugten höheren Frequenzspektrums mit dem niedrigeren Frequenzspektrum erhaltenen Frequenzspektrums in ein Signal in einem Zeitbereich durchführt.
  23. Decodierverfahren nach Anspruch 21 oder 22, dadurch gekennzeichnet, dass die Erweiterungsdaten weiterhin einen Parameter aufweisen, der die Energie eines Rauschspektrums festlegt, das zu dem höheren Frequenzspektrum addiert wird, das durch den ersten Parameter, den zweiten Parameter und den dritten Parameter festgelegt wird, und die Höheres-Frequenzspektrum-Erzeugungseinheit ein Rauschspektrum mit einer Energie, die von dem Parameter festgelegt wird, der die Energie eines Rauschspektrums festlegt, zu dem erzeugten höheren Frequenzspektrum addiert.
  24. Decodierverfahren nach Anspruch 23, dadurch gekennzeichnet, dass der Parameter, der die Energie eines Rauschspektrums festlegt, ein Energie-Anteil des Rauschspektrums an dem höheren Frequenzspektrum ist.
  25. Decodierverfahren nach einem der Ansprüche 21 bis 24, dadurch gekennzeichnet, dass der erste Parameter Informationen enthält, die angeben, ob dieselben Erweiterungsinformationen wie die eines vorhergehenden Frames verwendet werden sollen oder nicht, und die Höheres-Frequenzspektrum-Erzeugungseinheit das höhere Frequenzspektrum unter Verwendung der Informationen erzeugt.
  26. Decodierverfahren nach Anspruch 25, dadurch gekennzeichnet, dass der erste Parameter Informationen enthält, die angeben, ob dieselben Erweiterungsinformationen wie die eines unmittelbar vorhergehenden Frames verwendet werden sollen oder nicht.
  27. Decodierprogramm zum Decodieren eines codierten Signals, wobei das Programm einen Computer veranlasst, das Codierverfahren (Anm. d. Übers.: muss wohl „Decodierverfahren" heißen) nach einem der Ansprüche 21 bis 26 abzuarbeiten.
  28. Maschinenlesbares Aufzeichnungsmedium, das das Decodierprogramm nach Anspruch 27 aufzeichnet.
  29. Codiertes Signal, das ein Signal mit einem niedrigeren Frequenzspektrum und einem höheren Frequenzspektrum mit einer Frequenz darstellt, die höher als das niedrigere Frequenzspektrum ist, mit: einer Vielzahl von Teilspektren, die das niedrigere Frequenzspektrum darstellen; und Erweiterungsdaten, die zum Festlegen des höheren Frequenzspektrums als Kopie eines Teilspektrums des niedrigeren Frequenzspektrums dienen, wobei die Erweiterungsdaten einen ersten Parameter, einen zweiten Parameter und einen dritten Parameter aufweisen, wobei der erste Parameter ein einzelnes Teilspektrum darstellt, das als das höhere Frequenzspektrum einer Vielzahl der das niedrigere Frequenzspektrum bildenden Teilspektren kopiert werden soll, der zweite Parameter eine Verstärkung des Teilspektrums nach dem Kopieren darstellt und der dritte Parameter eine Frequenzposition eines Teilspektrums mit der niedrigsten Frequenzkomponente von zum Erzeugen der Erweiterungsdaten dienenden Teilspektren einer Vielzahl der das niedrigere Frequenzspektrum bildenden Teilspektren darstellt.
DE60214027T 2001-11-14 2002-11-07 Kodiervorrichtung und dekodiervorrichtung Expired - Lifetime DE60214027T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001348412 2001-11-14
JP2001348412 2001-11-14
PCT/JP2002/011605 WO2003042979A2 (en) 2001-11-14 2002-11-07 Encoding device and decoding device

Publications (2)

Publication Number Publication Date
DE60214027D1 DE60214027D1 (de) 2006-09-28
DE60214027T2 true DE60214027T2 (de) 2007-02-15

Family

ID=19161235

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60214027T Expired - Lifetime DE60214027T2 (de) 2001-11-14 2002-11-07 Kodiervorrichtung und dekodiervorrichtung

Country Status (7)

Country Link
US (14) US7139702B2 (de)
EP (2) EP1444688B1 (de)
JP (1) JP5048697B2 (de)
KR (1) KR100935961B1 (de)
CN (1) CN100395817C (de)
DE (1) DE60214027T2 (de)
WO (1) WO2003042979A2 (de)

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100935961B1 (ko) 2001-11-14 2010-01-08 파나소닉 주식회사 부호화 장치 및 복호화 장치
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP3861770B2 (ja) 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
JP4679049B2 (ja) 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
BRPI0415464B1 (pt) * 2003-10-23 2019-04-24 Panasonic Intellectual Property Management Co., Ltd. Aparelho e método de codificação de espectro.
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
KR101213840B1 (ko) * 2004-05-14 2012-12-20 파나소닉 주식회사 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
WO2005112001A1 (ja) 2004-05-19 2005-11-24 Matsushita Electric Industrial Co., Ltd. 符号化装置、復号化装置、およびこれらの方法
JP4774820B2 (ja) * 2004-06-16 2011-09-14 株式会社日立製作所 電子透かし埋め込み方法
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
EP2273494A3 (de) * 2004-09-17 2012-11-14 Panasonic Corporation Skalierbare Kodierungsvorrichtung, skalierbare Dekodierungsvorrichtung
EP1798724B1 (de) 2004-11-05 2014-06-18 Panasonic Corporation Kodierer, dekodierer, kodiermethode und dekodiermethode
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
ES2350494T3 (es) * 2005-04-01 2011-01-24 Qualcomm Incorporated Procedimiento y aparatos para codificar y decodificar una parte de banda alta de una señal de habla.
US8086451B2 (en) 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8296134B2 (en) * 2005-05-13 2012-10-23 Panasonic Corporation Audio encoding apparatus and spectrum modifying method
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
WO2007052088A1 (en) * 2005-11-04 2007-05-10 Nokia Corporation Audio compression
KR100739786B1 (ko) * 2006-01-20 2007-07-13 삼성전자주식회사 다중 채널 디지털 앰프 시스템 및 그 신호 처리 방법
EP2017830B9 (de) * 2006-05-10 2011-02-23 Panasonic Corporation Codierungseinrichtung und codierungsverfahren
US20070270987A1 (en) * 2006-05-18 2007-11-22 Sharp Kabushiki Kaisha Signal processing method, signal processing apparatus and recording medium
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
WO2007148925A1 (en) 2006-06-21 2007-12-27 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US20080071550A1 (en) * 2006-09-18 2008-03-20 Samsung Electronics Co., Ltd. Method and apparatus to encode and decode audio signal by using bandwidth extension technique
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
EP2101318B1 (de) * 2006-12-13 2014-06-04 Panasonic Corporation Kodierungseinrichtung, Dekodierungseinrichtung und entsprechende Verfahren
US8560328B2 (en) 2006-12-15 2013-10-15 Panasonic Corporation Encoding device, decoding device, and method thereof
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
MX2010001394A (es) * 2007-08-27 2010-03-10 Ericsson Telefon Ab L M Frecuencia de transicion adaptiva entre llenado de ruido y extension de anchura de banda.
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
EP2210253A4 (de) 2007-11-21 2010-12-01 Lg Electronics Inc Verfahren und vorrichtung zur verarbeitung eines signals
US8004432B2 (en) 2007-11-30 2011-08-23 Shimadzu Corporation Time-of-flight measuring device
RU2439720C1 (ru) * 2007-12-18 2012-01-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки звукового сигнала
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
CN101527138B (zh) * 2008-03-05 2011-12-28 华为技术有限公司 超宽带扩展编码、解码方法、编解码器及超宽带扩展系统
CN101604983B (zh) * 2008-06-12 2013-04-24 华为技术有限公司 编解码装置、系统及其方法
CN101620854B (zh) * 2008-06-30 2012-04-04 华为技术有限公司 频带扩展的方法、系统和设备
CN101836253B (zh) * 2008-07-11 2012-06-13 弗劳恩霍夫应用研究促进协会 一种使用频谱倾斜控制成帧技术来计算带宽扩展数据的装置及方法
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (de) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Vorrichtung und Verfahren zur Erzeugung eines synthetischen Audiosignals und zur Kodierung eines Audiosignals
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
CN102428512A (zh) * 2009-06-02 2012-04-25 松下电器产业株式会社 下混装置、编码装置以及其方法
CN101990253A (zh) * 2009-07-31 2011-03-23 数维科技(北京)有限公司 一种带宽扩展方法及其装置
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102598125B (zh) * 2009-11-13 2014-07-02 松下电器产业株式会社 编码装置、解码装置及其方法
EP2502230B1 (de) * 2009-11-19 2014-05-21 Telefonaktiebolaget L M Ericsson (PUBL) Anregungssignale zur verbesserten bandbreitenausdehnung
CN102131081A (zh) * 2010-01-13 2011-07-20 华为技术有限公司 混合维度编解码方法和装置
EP2525357B1 (de) * 2010-01-15 2015-12-02 LG Electronics Inc. Verfahren und vorrichtung zur verarbeitung eines tonsignals
JP5651980B2 (ja) * 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
JP5609737B2 (ja) * 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP2012032713A (ja) * 2010-08-02 2012-02-16 Sony Corp 復号装置、復号方法、およびプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
EP2603913B1 (de) 2010-08-12 2014-06-11 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Neuabtastung von ausgangssignalen von audiocodecs auf qmf-basis
WO2012026741A2 (ko) * 2010-08-24 2012-03-01 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2631905A4 (de) * 2010-10-18 2014-04-30 Panasonic Corp Vorrichtung zur tonkodierung und tondekodierung
MX2013007489A (es) 2010-12-29 2013-11-20 Samsung Electronics Co Ltd Aparato y metodo para codificacion/decodificacion para extension de ancho de banda de alta frecuencia.
CN103460286B (zh) 2011-02-08 2015-07-15 Lg电子株式会社 带宽扩展的方法和设备
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
JP5704018B2 (ja) * 2011-08-05 2015-04-22 富士通セミコンダクター株式会社 オーディオ信号符号化方法および装置
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
PL2791937T3 (pl) * 2011-11-02 2016-11-30 Wytworzenie rozszerzenia pasma wysokiego sygnału dźwiękowego o poszerzonym paśmie
WO2013118398A1 (ja) 2012-02-08 2013-08-15 国立大学法人九州工業大学 生体情報処理装置、生体情報処理システム、生体情報の圧縮方法、及び、生体情報の圧縮処理プログラム
CN103366751B (zh) * 2012-03-28 2015-10-14 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN103366749B (zh) * 2012-03-28 2016-01-27 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
HUE028238T2 (en) * 2012-03-29 2016-12-28 ERICSSON TELEFON AB L M (publ) Extend the bandwidth of a harmonic audio signal
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
WO2014185569A1 (ko) * 2013-05-15 2014-11-20 삼성전자 주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
KR101790901B1 (ko) * 2013-06-21 2017-10-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. Fdns 적용 이전에 백색 잡음으로의 mdct 스펙트럼의 페이딩을 실현하는 장치 및 방법
EP3048609A4 (de) 2013-09-19 2017-05-03 Sony Corporation Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren sowie programm
KR101498113B1 (ko) * 2013-10-23 2015-03-04 광주과학기술원 사운드 신호의 대역폭 확장 장치 및 방법
MX2016008172A (es) 2013-12-27 2016-10-21 Sony Corp Metodo y aparato de decodificacion, y programa.
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
CN105336339B (zh) * 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
US9786291B2 (en) * 2014-06-18 2017-10-10 Google Technology Holdings LLC Communicating information between devices using ultra high frequency audio
EP2963646A1 (de) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodierer und Verfahren zur Decodierung eines Audiosignals, Codierer und Verfahren zur Codierung eines Audiosignals
TWI693595B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI771266B (zh) 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
WO2018201113A1 (en) 2017-04-28 2018-11-01 Dts, Inc. Audio coder window and transform implementations
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10580424B2 (en) * 2018-06-01 2020-03-03 Qualcomm Incorporated Perceptual audio coding as sequential decision-making problems
US10734006B2 (en) 2018-06-01 2020-08-04 Qualcomm Incorporated Audio coding based on audio pattern recognition
CN113840328B (zh) * 2021-09-09 2023-10-20 锐捷网络股份有限公司 一种数据压缩方法、装置、电子设备及存储介质

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US340385A (en) * 1886-04-20 Lubricator
US668072A (en) * 1900-04-14 1901-02-12 Edwin L Wilson Printer's quoin.
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
ATE173366T1 (de) * 1991-09-30 1998-11-15 Sony Corp Verfahren und anordnung zur audiodatenkompression
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
IT1257431B (it) * 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
JP3277679B2 (ja) * 1994-04-15 2002-04-22 ソニー株式会社 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
JP3334419B2 (ja) * 1995-04-20 2002-10-15 ソニー株式会社 ノイズ低減方法及びノイズ低減装置
JP3301473B2 (ja) 1995-09-27 2002-07-15 日本電信電話株式会社 広帯域音声信号復元方法
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
JP3243174B2 (ja) 1996-03-21 2002-01-07 株式会社日立国際電気 狭帯域音声信号の周波数帯域拡張回路
US5794180A (en) * 1996-04-30 1998-08-11 Texas Instruments Incorporated Signal quantizer wherein average level replaces subframe steady-state levels
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US6115689A (en) * 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
CA2239294A1 (en) * 1998-05-29 1999-11-29 Majid Foodeei Methods and apparatus for efficient quantization of gain parameters in glpas speech coders
US6253165B1 (en) * 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
FR2791167B1 (fr) 1999-03-17 2003-01-10 Matra Nortel Communications Procedes de codage, de decodage et de transcodage audio
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US6879652B1 (en) * 2000-07-14 2005-04-12 Nielsen Media Research, Inc. Method for encoding an input signal
JP4470304B2 (ja) * 2000-09-14 2010-06-02 ソニー株式会社 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体
EP1382035A1 (de) * 2001-04-18 2004-01-21 Koninklijke Philips Electronics N.V. Audiokodierung
US6807528B1 (en) * 2001-05-08 2004-10-19 Dolby Laboratories Licensing Corporation Adding data to a compressed data frame
EP1386310A1 (de) 2001-05-11 2004-02-04 Matsushita Electric Industrial Co., Ltd. Vorrichtung zur kodierung, dekodierung und übertragung von audiosignalen mit verringerter spektraldatengrösse
DE60206269T2 (de) * 2001-06-08 2006-06-29 Koninklijke Philips Electronics N.V. Editieren von audiosignalen
US7400651B2 (en) * 2001-06-29 2008-07-15 Kabushiki Kaisha Kenwood Device and method for interpolating frequency components of signal
WO2003038389A1 (en) 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Encoding device, decoding device and audio data distribution system
KR100935961B1 (ko) * 2001-11-14 2010-01-08 파나소닉 주식회사 부호화 장치 및 복호화 장치
EP1635183B1 (de) * 2002-07-03 2007-11-21 Q-Star Test N.V. Vorrichtung zur Überwachung des Ruhestroms einer elektronischen Vorrichtung
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
EP1631954B1 (de) * 2003-05-27 2007-02-14 Koninklijke Philips Electronics N.V. Audiocodierung
DE602004023397D1 (de) * 2003-07-29 2009-11-12 Panasonic Corp Audiosignalband-expansionsvorrichtung und verfahren
WO2005083677A2 (en) * 2004-02-18 2005-09-09 Philips Intellectual Property & Standards Gmbh Method and system for generating training data for an automatic speech recogniser
US7396176B2 (en) * 2005-07-01 2008-07-08 Schoemer Karl G Corn on the cob buttering device

Also Published As

Publication number Publication date
EP1701340A3 (de) 2006-10-18
WO2003042979A2 (en) 2003-05-22
US7509254B2 (en) 2009-03-24
WO2003042979A3 (en) 2004-02-19
US7783496B2 (en) 2010-08-24
USRE44600E1 (en) 2013-11-12
USRE47935E1 (en) 2020-04-07
US20090157393A1 (en) 2009-06-18
EP1444688A2 (de) 2004-08-11
CN100395817C (zh) 2008-06-18
CN1527995A (zh) 2004-09-08
DE60214027D1 (de) 2006-09-28
JP2009116371A (ja) 2009-05-28
JP5048697B2 (ja) 2012-10-17
US20030093271A1 (en) 2003-05-15
USRE48145E1 (en) 2020-08-04
EP1701340A2 (de) 2006-09-13
EP1444688B1 (de) 2006-08-16
EP1701340B1 (de) 2012-08-29
USRE46565E1 (en) 2017-10-03
US20070005353A1 (en) 2007-01-04
USRE47949E1 (en) 2020-04-14
US20060287853A1 (en) 2006-12-21
US7308401B2 (en) 2007-12-11
KR20040063076A (ko) 2004-07-12
USRE47956E1 (en) 2020-04-21
USRE45042E1 (en) 2014-07-22
US20100280834A1 (en) 2010-11-04
USRE47814E1 (en) 2020-01-14
US7139702B2 (en) 2006-11-21
US8108222B2 (en) 2012-01-31
KR100935961B1 (ko) 2010-01-08
USRE48045E1 (en) 2020-06-09

Similar Documents

Publication Publication Date Title
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
DE60307252T2 (de) Einrichtungen, verfahren und programme zur kodierung und dekodierung
EP0290581B1 (de) Verfahren zum übertragen digitalisierter tonsignale
DE69233094T2 (de) Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden
DE60209888T2 (de) Kodieren eines audiosignals
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
DE19921122C1 (de) Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
EP1979901B1 (de) Verfahren und anordnungen zur audiosignalkodierung
DE60202881T2 (de) Wiederherstellung von hochfrequenzkomponenten
DE602004010188T2 (de) Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
DE60208426T2 (de) Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
DE69732761T2 (de) Verfahren und Vorrichtung zur kalkulierbaren Audiocodierung bzw.-decodie- rung
DE602004005197T2 (de) Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
DE69923555T2 (de) Verfahren und vorrichtung zur entropie-kodierung von quantisierten transformationskoeffizienten eines signals
DE60128121T2 (de) Wahrnehmungsbezogen verbesserte aufbesserung kodierter akustischer signale
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
DE60131766T2 (de) Wahrnehmungsbezogen verbesserte codierung akustischer signale
EP1869671A1 (de) Verfahren und vorrichtung zur geräuschunterdrückung
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE602004009926T2 (de) Vorrichtung und verfahren zum einbetten eines wasserzeichens unter verwendung von subbandfilterung
DE60011606T2 (de) Audiokodierung mit verstärkungsadaptiver quantisierung und symbolen verschiedener länge
DE60101984T2 (de) Verfahren zur Vorklassifikation von Audiosignalen für die Audio-Komprimierung
DE69823458T2 (de) Mehrband-Sprachdecoder
DE69931932T2 (de) Verfahren und Vorrichtung zum Dekodieren und Einfügen eines Wasserzeichens in einen Datenstrom

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: PANASONIC CORP., KADOMA, OSAKA, JP