DE19638997B4 - Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung - Google Patents

Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung Download PDF

Info

Publication number
DE19638997B4
DE19638997B4 DE19638997A DE19638997A DE19638997B4 DE 19638997 B4 DE19638997 B4 DE 19638997B4 DE 19638997 A DE19638997 A DE 19638997A DE 19638997 A DE19638997 A DE 19638997A DE 19638997 B4 DE19638997 B4 DE 19638997B4
Authority
DE
Germany
Prior art keywords
bits
frequency band
mean square
lookup table
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE19638997A
Other languages
English (en)
Other versions
DE19638997A1 (de
Inventor
Do-hyung Yongin Kim
Yeon-Bae Kim
Sang-Wook Kim
Yang-Seock Seo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1019950031352A external-priority patent/KR100300956B1/ko
Priority claimed from KR1019950031355A external-priority patent/KR100300957B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of DE19638997A1 publication Critical patent/DE19638997A1/de
Application granted granted Critical
Publication of DE19638997B4 publication Critical patent/DE19638997B4/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Abstract

Digitales Tonkodierverfahren, welches folgende Schritte umfasst:
Teilen eines Tonsignals im Zeitbereich in eine Anzahl von Frequenzbändern gleicher Breite;
Bestimmen einer Anzahl zugeordneter Bits für jedes Frequenzband, wobei das Bestimmen beinhaltet:
Berechnen einer Varianz, einer mittleren Quadratwurzel und eines Skalenfaktors für jedes Frequenzband,
Bestimmen von Reihenfolge-Nummern für die Varianz, die mittlere Quadratwurzel und den Skalenfaktor für jedes Frequenzband gemäß den relativen Größen der Varianzen, der mittleren Quadratwurzeln und der Skalenfaktoren aller Frequenzbänder,
Berechnen einer Adresse für jedes Frequenzband beruhend auf den Reihenfolge-Nummern, und
Extrahieren der Anzahl zugeordneter Bits aus einer Nachschlagtabelle unter Verwendung der für jedes Frequenzband berechneten Adresse;
Zuordnen der Bits zu jedem Frequenzband entsprechend der extrahierten Anzahl zugeordneter Bits und Quantisieren der zugeordneten Bits;
Bilden eines quantisierten Tonsignals als einen Bitstrom aus den quantisierten Bits.

Description

  • Die Erfindung betrifft ein digitales Toncodierungsverfahren sowie eine Vorrichtung zu dessen Durchführung und insbesondere ein digitales Toncodierungsverfahren, das mit einer Nachschlagtabelle LUT arbeitet, sowie eine Vorrichtung zu dessen Durchführung.
  • Auf dem Gebiet der Nachrichtentechnik werden heutzutage analoge Daten in digitale Daten umgewandelt. Dazu wird in allen tontechnischen Geräten und gleichfalls in Tondatenübertragungssystemen eine digitale Übertragung benötigt. Eine derartige digitale Tondatenübertragung ist gegenüber Nebengeräuschen unempfindlicher als es bei bestehenden analogen Übertragungsverfahren der Fall ist. Weiterhin ist eine Tonwiedergabe mit einer Qualität möglich, die so hoch wie bei einer CD-Platte ist. Da jedoch die Datenmenge zugenommen hat, die zu übertragen ist, haben sich viele Probleme hinsichtlich der Kapazität der Speicher oder der Übertragungskanäle ergeben.
  • Um diese Probleme zu überwinden, muß ein Kompressionsverfahren angewandt werden. Das Ziel eines Tonkompressionsverfahrens besteht darin, einen Ton originalgetreu wiederzugeben, indem der Originalton komprimiert wird, komprimierte Tondaten übertragen werden und danach die übertragenen Tondaten dekomprimiert und wiedergegeben werden.
  • Gegenwärtig wird diese Technik in fortschreitendem Maße überall angewandt. Die neuesten Produkte dieser Technik sind die sogenannte Minidisk (MD), die 1992 von der Firma Sony Corp. in Japan entwickelt wurde, und die digitale Compact Disc (DCC), die von der Firma Phillips Corp. hergestellt wird. Eine MD hat beispielsweise eine geringere Größe als die bestehende CD und erlaubt dennoch eine Tonwiedergabe mit der Qualität der Wiedergabe einer CD. Eine MD kann wesentlich mehr Daten als eine CD bei einem Kompressionsverhältnis von etwa 5:1 speichern. Eine MD ist darüber hinaus außerordentlich unempfindlich gegenüber Stößen von außen.
  • In der Zwischenzeit wurde andererseits eine internationale Normenorganisation für digitale Kompressionscodierungsverfahren, nämlich die MPEG (Moving Picture Expert Group) gegründet. Die MPEG-Norm ist grob in drei Bereiche, nämlich einen Systembereich, einen Bild- und einen Tonbereich aufgeteilt. Unter diesen ist der Tonbereich in drei Schichten, nämlich Schichten I und II nach dem MUSICAM-Verfahren von Philips Corporation und eine Schicht III nach dem Verfahren der modifizierten diskreten Kosinustransformation MDCT von AT&T, unterteilt.
  • Die MPEG vergleicht, analysiert und testet verschiedene Codierungsverfahren mit niedriger Übertragungsgeschwindigkeit, die vorgeschlagen werden, um internationale Standards oder Normen für die codierte Umsetzung von Bewegtbildern und entsprechenden Tonsignalen festzulegen. Wenn derartige internationale Normen festgelegt sind, müssen die Daten so codiert und gespeichert werden, daß sie diese Normen für alle digitalen Speicherträger erfüllen. Digitale Speicherträger schließen dabei die Compact-Disk-Festspeicher CD-ROM, die digitalen Tonbänder DAT, die magneto-optischen Platten MOD und die Computerplatten, beispielsweise die Festplatten, ein.
  • Beim Kompressionscodieren eines Tonsignals wird üblicherweise ein psychoakustisches Modell des Menschen benutzt. Mit Maskierungen und durch Verwendung kritischer Bänder innerhalb der akustischen Kennlinie wird ein nicht hörbares Signal entfernt und wird nur das benötigte Signal codiert und in einen Bitstrom umgewandelt, so daß eine Tonqualität nahezu gleich der des Originaltons selbst dann erzielt werden kann, wenn das Signal mit einer Anzahl von Bit codiert wird, die kleiner als die des Originalsignals ist.
  • Unter der Maskierung wird eine Erscheinung verstanden, die darin besteht, daß ein Mensch einen Ton dann überhaupt nicht wahrnimmt, wenn ein Signal mit einem anderen Signal maskiert wird, was auf einer Interferenz zwischen den Tonsignalen beruht. Ein kritisches Band, in dem eine Tonfrequenz von einem Menschen unterschieden wird, ist im allgemeinen in vierundzwanzig Teilbänder unterteilt. Je höher die Frequenz ist, umso breiter werden die Bänder in einer logarithmischen Skala. Dementsprechend ist die Unterscheidung eines höherfrequenten Signals nicht so einfach wie die eines niederfrequenten Signals.
  • Um ein Bit unter Verwendung derartiger akustischer Charakteristiken zuzuordnen, werden ein Signalrauschverhältnis SNR und ein Signalmaskenverhältnis SMR gebildet und muß dann ein Maskenrauschverhältnis MNR daraus berechnet werden. Ein Maskenpegel ist dabei der kleinst Signalpegel, der von einem Menschen nicht wahrnehmbar ist. Es ist daher nicht notwendig, einem Signal unter diesem Maskenpegel ein Bit zuzuordnen.
  • Ein endgültiges MNR-Verhältnis wird über den obigen Arbeitsvorgang gebildet, und es wird dann ein Bit wiederholt auf der Grundlage dieses endgültigen MNR-Verhältnisses zugeordnet. Während eines derartigen Arbeitsvorgangs wird jedoch sehr viel Arbeitszeit benötigt, was bedeutet, daß die Echtzeitverzögerung in einem Codierer zunimmt. Es wäre daher notwendig, die Komplexität dieser Arbeitsweise zu verringern.
  • Im folgenden wird anhand von 1 eine übliche MPEG-Toncodierungsvorrichtung kurz beschrieben.
  • Ein Frequenzabbildungsteil 11 wandelt Tondaten im Zeitbereich in Daten eines Frequenzbereiches mit 32 gleichen Bändern unter Verwendung eines Bandanalysefilters um. Dabei enthält jedes Band zwölf Samples, d. h. Tondaten in jedem Frequenzband nach der Transformation der eingegebenen pulscodemodulierten Tondaten vom Zeitbereich in den Frequenzbereich, im Fall einer Schicht I, und sechsunddreißig Samples im Fall einer Schicht II. Da die Anzahl der Skalenfaktoren insgesamt vierundsechzig beträgt, ist die Anzahl der Bit, die zum Codieren dieser Information benötigt wird, gleich sechs. In Abhängigkeit von den Schichten gibt es einen geringfügigen Unterschied zwischen den Codierungsverfahren. Bei der Schicht I wird unter den zwölf Samples in jedem Band der größte Wert ermittelt und wird dieser oder ein etwas größerer Wert als Skalenfaktor gewählt. Da bei der Schicht II in jedem Band drei Skalenfaktoren bestehen, wird eine Ähnlichkeit in den jeweiligen Skalenfaktoren untersucht, um dann zu entscheiden, wieviele der drei Skalenfaktoren zu codieren sind. Das heißt mit anderen Worten, daß die Anzahl der zu codierenden Skalenfaktoren in Abhängigkeit von dem Bereich des Unterschiedes zwischen benachbarten Skalenfaktoren abhängt. Im Gegensatz zur Schicht I, bei der die Information mit 2 Bit codiert wird, wird dementsprechend eine zusätzliche Information beim Wählen eines Skalenfaktors benötigt.
  • Ein psychoakustisches Modell 13 ist dasjenige Bauteil, dessen Arbeitsweise in der Codierungsvorrichtung am komplexesten ist. Der endgültige Ausgangswert des psychoakustischen Modells ist ein SMR-Verhältnis jedes Bandes als Standard einer Bit-Zuordnung. Das SMR-Verhältnis wird durch die folgende Reihe von Schritten berechnet. Ein Tonsignal im Zeitbereich wird in ein Tonsignal im Frequenzbereich über eine schnelle Fourier-Transformation FFT in einem ersten Schritt umgewandelt. In einem zweiten Schritt wird ein Schalldruckpegel für jedes Band berechnet. In einem dritten Schritt wird ein absoluter Schwellenwert berechnet. In einem vierten Schritt wird über stimmhafte und stimmlose Tonanteile im Tonsignal entschieden. In einem fünften Schritt wird über einen Maskierer entschieden. In einem sechsten Schritt wird ein absoluter Schwellenwert jedes Bandes berechnet. In einem siebten Schritt wird der gesamte absolute Schwellenwert berechnet. In einem achten Schritt wird ein minimaler absoluter Schwellenwert jedes Bandes berechnet. In einem neunten Schritt wird der SMR-Wert jedes Bandes berechnet.
  • In einem Bit-Zuordnungs- und Quantisierungsteil 15 wird zunächst in einem Bit-Zuordnungsschritt die Menge der zugeordneten Bit jeweils dadurch erhalten, daß wiederholt die folgenden Schritte nacheinander auf der Grundlage des SMR- Wertes ausgeführt werden, der durch das psychoakustische Modell 13 erhalten wurde. In einem ersten Schritt wird ein am Anfang zugeordnetes Bit auf Null gesetzt. In einem zweiten Schritt wird ein MNR-Wert jedes Bandes erhalten. Dieser MNR-Wert wird dadurch erhalten, daß die Differenz zwischen dem SNR-Wert und dem SMR-Wert gebildet wird. In einem dritten Schritt wird das Band aufgesucht, das den kleinsten MNR-Wert unter den MNR-Werten hat, die für die jeweiligen Bänder erhalten wurden, und wird dann die Zahl der zugeordneten Bit um 1 erhöht. In einem vierten Schritt werden der zweite und der dritte Schritt wiederholt bezüglich der restlichen Bänder ausgeführt, wenn die erforderliche Anzahl von Bit im vierten Schritt nicht überschritten ist.
  • Die Quantisierung wird andererseits über die Abfolge der folgenden Schritte ausgeführt. In einem ersten Schritt werden die Samples jedes Bandes durch einen Skalenfaktor geteilt, um den Wert, der dadurch erhalten wird, als X festzulegen. In einem zweiten Schritt wird ein Wert A·X + B berechnet (wobei A und B bestimmte Werte sind). In einem dritten Schritt wird unter den berechneten Werten die Anzahl der zugeordneten Bit vom Bit-Zuordnungsschritt genommen. In einem vierten Schritt wird das höchstwertige Bit MSB umgekehrt.
  • Da in der oben beschriebenen Weise die herkömmliche digitale Toncodierungsvorrichtung ein psychoakustisches Modell benutzt, ist ein Arbeitsvorgang in neun Schritten erforderlich, um den SMR-Wert zu erhalten. Die Komplexität des Arbeitsvorganges nimmt daher zu, was einen starken Einfluß auf die Gesamtzeit zur Ausführung hat. Darüber hinaus wird unter Verwendung der SMR-Werte, die nach einem derartigen Verfahren erhalten werden, erneut ein MNR-Wert berechnet. Eine Zeitverzögerung bei einem derartigen Arbeitsvorgang tritt auch aufgrund des wiederholten Durchlaufs der Bit-Zuordnungsschleifen auf der Grundlage des in dieser Weise berechneten MNR-Wertes auf.
  • Als Ergebnis eines praktischen Versuches ergibt sich aus der folgenden Tabelle 1, daß die Kompliziertheit des Arbeitsablaufes bei der Bildung des psychoakustischen Modells und bei der Bit-Zuordnung groß ist, d. h. etwa 49,9 der Durchführungszeit des gesamten Codierungsvorgangs einnimmt. Tabelle 1
    Gesamtarbeitszeit der Codiervorrichtung (1/60 s) Psychoakustisches Modell und Bit-Zuordnung (1/60 s) Rate (%)
    22662 11590 49.9
  • Aus den Druckschriften US 4,535,472 und US 4,926,482 sind digitale Toncodierverfahren zum Zuordnen von Bits unter Verwendung einer vorbereiteten Nachschlagtabelle bekannt, wobei die Bitzuordnungsmenge aus der Nachschlagtabelle beruhend auf der Varianz des Toneingangssignals ausgelesen wird.
  • Ferner sind im Stand der Technik digitale Toncodierverfahren aus DE 37 84 120 T2 , EP 0 525 774 A2 und JP 07050589 A bekannt.
  • Um die oben beschriebenen Probleme zu beseitigen, soll durch die vorliegende Erfindung ein digitales Toncodierungsverfahren zum Zuordnen von Bit geschaffen werden, bei dem die Bit-Zuordnungsmenge, die von den Toneingangssignalcharakteristiken Varianz, mittlere Quadratwurzel und Skalenfaktor abhängt, unter Verwendung einer vorbereiteten Nachschlagtabelle vorbereitet wird, die mit den bestehenden MPEG-Normen kompatibel ist, um die Verzögerungszeit für die Tonkompressionscodierung zu verringern, und bei dem dann unter Verwendung der Nachschlagtabelle Bit zugeordnet werden.
  • Durch die Erfindung soll weiterhin eine Vorrichtung geschaffen werden, die nach einem derartigen digitalen Toncodierungsverfahren arbeiten kann.
  • Das erfindungsgemäße digitale Toncodierungsverfahren umfaßt die folgenden Schritte:
    Teilen eines Tonsignals im Zeitbereich in eine Anzahl von Frequenzbändern gleicher Breite;
    Bestimmen einer Anzahl zugeordneter Bits für jedes Frequenzband, wobei das Bestimmen beinhaltet:
    Berechnen einer Varianz, einer mittleren Quadratwurzel und eines Skalenfaktors für jedes Frequenzband,
    Bestimmen von Reihenfolge-Nummern für die Varianz, die mittlere Quadratwurzel und den Skalenfaktor für jedes Frequenzband gemäß den relativen Größen der Varianzen, der mittleren Quadratwurzeln und der Skalenfaktoren aller Frequenzbänder,
    Berechnen einer Adresse für jedes Frequenzband beruhend auf den Reihenfolge-Nummern, und
    Gewinnen der Anzahl zugeordneter Bits aus einer Nachschlagtabelle unter Verwendung der für jedes Frequenzband berechneten Adresse;
    Zuordnen der Bits zu jedem Frequenzband entsprechend der gewonnenen Anzahl zugeordneter Bits und Quantisieren der zugeordneten Bits;
    Bilden eines quantisierten Tonsignals als einen Bitstrom aus den quantisierten Bits.
  • Die erfindungsgemäße digitale Toncodiervorrichtung umfaßt:
    einen Frequenzabbildungsteil zur Teilung eines Tonsignals im Zeitbereich in eine erste Anzahl gleicher Frequenzbänder;
    eine Nachschlagtabelle beinhaltend zugeordnete Bitanzahlen zur Codierung eines Frequenzbandes, wobei die zugeordneten Bitanzahlen an Adressen gespeichert sind, die einer Größenreihenfolge von Charakteristiken des Frequenzbandes entsprechen, wobei die Charakteristiken eine Varianz, einen Skalenfaktor und eine mittlere Quadratwurzel beinhalten;
    einen Charakteristikgewinnungsteil zur Bestimmung der Adressen der Nachschlagtabelle gemäß der Größenreihenfolge der Charakteristiken des Tonsignals, wobei das Charakteristikgewinnungsteil umfasst:
    ein Berechnungsteil zur Berechnung der Charakteristiken jedes Frequenzbandes des Tonsignals, einen Bestimmungsteil zur Bestimmung von Reihenfolge-Nummern für jedes Frequenzband gemäß den relativen Größen der Charakteristiken jedes Frequenzbandes unter Bezug auf alle Frequenzbänder und
    einen Adressenberechnungsteil zur Berechnung einer Adresse zum Gewinnen einer zugeordneten Bitanzahl aus der Nachschlagtabelle beruhend auf den Reihenfolge-Nummern für die Charakteristiken jedes Frequenzbandes;
    einen Bitzuordnungs- und Quantisierungsteil zum Zuordnen von Bits, die den Adressen in der Nachschlagtabelle entsprechen, zu jedem Frequenzband und zum Quantisieren der zugeordneten Bits; und
    einen Datenblockbildungsteil zur Bildung eines quantisierten Tonsignals aus den quantisierten Bits als einen Bitstrom.
  • Ein weiteres erfindungsgemäßes Toncodierverfahren bzw. eine weitere erfindungsgemäße Toncodiervorrichtung umfassen die Merkmale der Ansprüche 4 bzw. 14.
  • Im folgenden werden anhand der zugehörigen Zeichnung besonders bevorzugte Ausführungsbeispiele der Erfindung näher beschrieben. Es zeigen
  • 1 in einem Blockschaltbild einen üblichen MPEG-Toncodierer,
  • 2A und 2B in graphischen Darstellungen die Varianz eines Toneingangssignals, wobei jeweils große und kleine Streuungen dargestellt sind,
  • 3 eine Darstellung zur Erläuterung des Arbeitsvor ganges der Erzeugung einer Nachschlagtabelle, die gemäß der Erfindung verwandt wird,
  • 4 die Verteilung der zugeordneten Bit in der Nachschlagtabelle für ein Band 0 nach Maßgabe von Adressen,
  • 5 die Verteilung von zugeordneten Bit in der Nachschlagtabelle für ein Band 1 nach Maßgabe von Adressen,
  • 6 die Verteilung von zugeordneten Bit in der Nachschlagtabelle für ein Band 2 nach Maßgabe von Adressen,
  • 7 die Verteilung von zugeordneten Bit in der Nachschlagtabelle für ein Band 3 nach Maßgabe von Adressen,
  • 8 die Verteilung von zugeordneten Bit in der Nachschlagtabelle für ein Band 4 nach Maßgabe von Adressen,
  • 9 die Verteilung von zugeordneten Bit in der Nachschlagtabelle für ein Band 5 nach Maßgabe von Adressen,
  • 10 die Verteilung von zugeordneten Bit in der Nachschlagtabelle für ein Band 28 nach Maßgabe von Adressen,
  • 11 in einer graphischen Darstellung die Beziehung zwischen einem absoluten Schwellenwert und 32 Bändern im Frequenzbereich,
  • 12 in einem Blockschaltbild ein Ausführungsbeispiel der erfindungsgemäßen digitalen Codiervorrichtung, die eine Nachschlagtabelle verwendet,
  • 13 eine graphische Darstellung zum Vergleich der Leistungsfähigkeit bezüglich eines NMR-Wertes eines linken Kanals zwischen der MPEG-Norm und der erfindungsgemäßen Codiervorrichtung und
  • 14 eine graphische Darstellung zum Vergleich der Leistungsfähigkeit bezüglich eines NMR-Wertes eines rechten Kanals zwischen der MPEG-Norm und der erfindungsgemäßen Codiervorrichtung.
  • Ein Bit-Zuordnungsverfahren dient dazu, Bit unter Verwendung einer vorbereiteten Nachschlagtabelle LUT als wesentlichen Bestandteil der Erfindung zuzuordnen, anstatt den psychoakustischen Modellteil 13 und den Bit-Zuordnungs- und Quantisierungsteil 15 zu verwenden. Eine derartige digitale Toncodiervorrichtung ist in 12 dargestellt. Im folgenden wird das Verfahren der Erzeugung der Nachschlagtabelle LUT beschrieben, die für die Bit-Zuordnung benötigt wird.
  • Eine LUT ist eine Tabelle zum Entscheiden über die Menge der zugeordneten Bit für jedes Band und wird dazu verwandt, die Zeit, die für die Bit-Zuordnung benötigt wird, auf ein Minimum herabzusetzen. Da die Gesamtarbeitszeit dadurch verringert wird, daß die Schritte des Analysierens des Eingangssignals in einem Frequenzbereich wie beispielsweise die Schritte der Ausführung der schnellen Fourier-Transformation im psychoakustischen Modell oder der Leistungsverteilung fehlen, werden zu diesem Zweck die Charakteristiken eines Zeitbereiches für ein Eingangssignal betrachtet. Das heißt mit anderen Worten, daß das Eingangssignal nicht im Frequenzbereich interpretiert wird, sondern daß dessen Charakteristiken im Zeitbereich ermittelt werden, um dadurch die gefundenen Werte als Standard zur Bildung der Nachschlagtabelle LUT festzulegen.
  • Bei einem ersten Ausführungsbeispiel der Erfindung werden diese Charakteristiken als Varianz, Skalenfaktor und mittlere Quadratwurzel beschrieben. Natürlich werden derartige Charakteristiken mittels eines Bandanalysefilters des Frequenzabbildungsteils 11 in 1 erhalten, so daß sie bei der Entscheidung über die Adressen der Nachschlagtabelle LUT verfügbar sind. Derartige Charakteristiken werden zunächst kurz beschrieben, woraufhin das Verfahren der Verwendung der Charakteristiken bei einem Codieralgorithmus erläutert wird.
  • Die Varianzcharakteristik ist zunächst ein Faktor, der besagt, wie eng die Eingangssignale am Mittelwert verteilt sind. Das heißt mit anderen Worten, daß dann, wenn in 2A die Varianz groß ist, der dynamische Bereich für ein Eingangssignal zunimmt und viele Bit zugeordnet werden müssen, um das Quantisierungsrauschen zu verringern. Wenn gemäß 2B die Varianz klein ist, spielt sie keine Rolle, selbst wenn der Anteil an zugeordneten Bit klein ist. Da im allgemeinen die Bänder, denen viele Bit tatsächlich zugeordnet werden, diejenigen eines niederfrequenten Bereiches, d. h. die Bänder 0 bis 7, unter den 32 Bändern sind, hat die Varianz auch einen großen Wert in diesen Bändern insgesamt. Um gemäß der Erfindung die Varianz zu erhalten, geht das Eingangssignal über ein Bandanalysefilter, um zwölf Samples für jedes Band der zweiunddreißig Bänder zu erhalten. Es werden zunächst ein Mittelwert (m(sb)) und ein Quadratmittelwert (ms(sb)) für die zwölf Samples gebildet und es wird dann die Varianz (v(sb)) jedes Bandes nach der folgenden Gleichung erhalten: v(sb) = ms(sb) – m(sb)2 (1)
  • Die Charakteristik der mittleren Quadratwurzel (rms(sb)) ist weiterhin ein ähnliches Konzept wie das des Mittelwertes. Der Mittelwert für das Eingangssignal ist jedoch im Fall einer Sinus- oder Kosinuswelle Null, was keine Bedeutung hat. Die mittlere Quadratwurzel könnte daher eine der Charakteristiken sein, die dadurch erhalten wird, daß das Quadrat des Eingangssignals gemittelt und dann die Quadratwurzel des gemittelten Wertes gebildet wird. Das ist mit anderen Worten dasselbe wie die Quadratwurzel des quadratischen Mittelwertes, der beim Bilden der Varianz erhalten wird. Diese mittlere Quadratwurzel (rms(sb)) läßt sich durch die folgende Gleichung (2) ausdrücken: rms(sb) = √ms(sb) (2)
  • Im folgenden wird die Beziehung zwischen der mittleren Quadratwurzel und der Varianz analysiert oder analogisiert. Wenn der Mittelwert eines Bandes nahezu gleich Null ist, dann ist die Varianz die gleiche wie die des quadratischen Mittelwertes, und zwar nach der obigen Gleichung (1), so daß die beiden Charakteristiken eine konstante Linearität haben. Je größer im allgemeinen der Mittelwert der Signale ist, umso größer ist die mittlere Quadratwurzel und umso größer ist die Leistung, durch die die Beziehung zu einer zugeordneten Bit-Menge gefunden werden kann.
  • Als drittes wird im folgenden die Charakteristik eines Skalenfaktors beschrieben. Der Skalenfaktor wird beim Berechnen eines Maskenpegels jedes Bandes benutzt, indem die Leistung des Bandes im psychoakustischen Modell erhalten wird. Im allgemeinen sollten mehr Bit zugeordnet werden, wenn die Leistung eines Eingangssignals größer ist. In Hinblick auf einen Zeitbereich kann über die Leistung in einem Frequenzbereich hauptsächlich über die Größe der Eingangssignalwerte des Zeitbereiches entschieden werden. Unter Berücksichtigung derartiger Charakteristiken wird der größte Samplewert für jedes Band als Leistung des Bandes angesehen. Der Samplewert wird Skalenfaktor genannt. Wenn ein Skalenfaktor eines beliebigen Bandes groß ist, wird angenommen, daß die Leistung des Bandes groß ist. Der Skalenfaktor wird auch dazu benutzt, den Wert jedes Bandes während eines Quantisierungsvorgangs zu normieren.
  • Bei der Bildung der Nachschlagtabelle LUT unter Verwendung der Charakteristiken der Tonsignale ist es wichtig, wie die Charakteristiken beim Auffinden der Adressen der Nachschlagtabelle LUT benutzt werden. Wenn alle derartigen Charakteristiken betrachtet werden, sollte mit anderen Worten die Adresse der Nachschlagtabelle LUT aufgesucht werden können und sollte über die entsprechende zugeordnete Bit-Menge entschieden werden können. Zu diesem Zweck werden gemäß der Erfindung alle möglichen Fallgestaltungen der drei Charakteristiken betrachtet. Die Charakteristiken werden in der Reihenfolge der Größe für jedes Band angeordnet, und die Nachschlagtabelle wird in der Größenfolge gebildet. Da in diesem Fall bezüglich eines Bandes die drei Charakteristiken in einer Folge von 0 bis 31 angeordnet sind, ergibt sich eine Gesamtanzahl von Fällen von 32768 (=323). Für jedes Band sollten 32768 Fälle betrachtet werden.
  • Allen 32768 Fällen wird jeweils eine Nummer gegeben, und die zugeordnete Bit-Menge für jeden Fall wird untersucht, um über den häufigsten Wert der zugeordneten Bit-Menge für das Band zu entscheiden. Dieses Verfahren ist zuverlässig, da es einfach der Reihenfolge der Größe unabhängig vom Bereich des maximalen oder minimalen Wertes für beliebige Tondaten folgt.
  • Im folgenden wird beschrieben, wie mit dem oben beschriebenen Verfahren die Nachschlagtabelle LUT gebildet wird.
  • 3 zeigt eine Darstellung zur Erläuterung des Verfahrens der Bildung der Nachschlagtabelle LUT. Zunächst werden die Toneingangsdaten über das Bandanalysefilter des Frequenzabbildungsteils 31 geführt und wird dann der Maximalwert jedes Bandes erhalten, der Skalenfaktor sf genannt wird. Die Varianz und die mittlere Quadratwurzel werden für jedes Band unter Verwendung der ersten und der zweiten Gleichung gebildet, und die drei Charakteristiken werden anschließend in der Reihenfolge ihrer Größe angeordnet. Ein psychoakustisches Modell 33 wird andererseits auf die Toneingangsdaten angewandt, um einen SMR-Wert zu erhalten, und es wird dann eine zugeordnete Bit-Menge für jedes Band auf der Grundlage des SMR-Wertes erhalten. Die Nachschlagtabelle LUT wird auf der Grundlage der zugeordneten Bit-Menge und der Reihenfolge der drei Charakteristiken für jedes Band gebildet. Das heißt mit anderen Worten, daß dann, wenn für ein Band 0 die zugeordnete Bit-Menge durch das psychoakustische Modell gleich 4 ist und die Reihenfolge der drei Charakteristiken des Bandes 2-3-1 ist, die Anzahl der Frequenzen um 1 im Vier-Bit-Bereich der entsprechenden Adresse erhöht wird. Ein derartiges Verfahren wird wiederholt bezüglich der zwölf Tondaten gemäß der vorliegenden Erfindung ausgeführt. Dann wird die häufigste Bit-Menge als zugeordnete Bit-Menge für das Band bezeichnet. Je mehr Tondaten in der Statistik benutzt werden, umso aufwendiger ist die Bildung der Nachschlagtabelle LUT.
  • Das Verfahren der Bildung der Adresse (addr) als Reihenfolge der drei Charakteristiken für jedes Band kann andererseits durch die folgende Gleichung 3 ausgedrückt werden: addr = v × 322 + rms × 321 + sf × 320 (3)
  • Mit v, rms und sf ist dabei die Größe der drei Charakteristiken, d. h. der Varianz, der mittleren Quadratwurzel und des Skalenfaktors, bezeichnet. Die folgende Tabelle 2 zeigt das Verfahren der Berechnung der Adresse der Nachschlagtabelle LUT als Reihenfolge der drei Charakteristiken für jedes Band. Tabelle 2
    Adresse Varianzreihenfolge Reihenfolge mittlere Quadratwurzel Reihenfolge Skalenfaktor
    0 0 0 0
    1 0 0 1
    ... ... ... ...
    16384 16 0 0
    16385 16 0 1
    ... ... ... ...
    32766 31 31 30
    32767 31 31 31
  • Die folgende Tabelle 3 drückt andererseits einen Zwischenerzeugungsschritt der LUT aus. Tabelle 3 → Band 0
    Adresse Varianz mittlere Quadratwurzel Skalenfaktor 0 1 2 3 4
    0 0 0 0 0 0 0 2594 6733
    .. .. .. .. .. .. .. .. ..
    3212 3 4 12 0 4 100 2544 986
    .. .. .. .. .. .. .. .. ..
    32767 31 31 31 9 0 1 0 0
    → Band 31
    Adresse Varianz mittlere Quadratwurzel Skalenfaktor 0 1 2 3 4
    0 0 0 0 0 0 0 0 0
    .. .. .. .. .. .. .. .. ..
    3212 3 4 12 68 79 120 0 0
    .. .. .. .. .. .. .. .. ..
    32767 31 31 31 6832 2300 10 0 0
  • In der obigen Tabelle 3 geben die fettgedruckten Zahlen die häufigsten Zahlen wieder. Wenn beispielsweise beim Band 0 die Größen der Varianz, der mittleren Quadratwurzel und des Skalenfaktors alle gleich Null sind, dann ist die Anzahl an Frequenzen beim Zuordnen von 4 Bit am größten. In diesem Fall werden an der Adresse 0 in der Nachschlagtabelle LUT 4 Bit gespeichert. Der Grund für die Speicherung der Adresse in der Nachschlagtabelle LUT besteht darin, daß die Adresseninformation notwendig ist, da die 0-Bit-Speicheradresse während eines LUT-Optimierungsvorganges ausgeschlossen wird.
  • Wenn weiterhin die Varianz, die mittlere Quadratwurzel und der Skalenfaktor in ihrer Größe gleich 3, 4 und 12 jeweils sind, werden 3 Bit der Nachschlagtabelle LUT mit der Adresse 3212 zur Speicherung eingegeben. Wenn es zwei häufigste Bänder gibt, wird das größere Bit-Band gewählt. Experimentelle Ergebnisse haben gezeigt, daß der Unterschied zwischen der tatsächlich zugeordneten Bit-Menge und der erforderlichen Bit-Menge dadurch verringert werden kann.
  • Wie es in Tabelle 3 angegeben ist, sind andererseits die drei Charakteristiken insgesamt auf die unteren Adressen für die Bänder der unteren Reihenfolge verteilt. Für ein höheres Band bewegt sich die Verteilung der Charakteristiken zu höheren Adressen. Das heißt mit anderen Worten, daß die Stärke dieser drei Charakteristiken insgesamt bei unteren Frequenzen groß ist. Es ist daher möglich, nur die Charakteristiken bei einer Toncodierung anzuwenden.
  • Die 4 bis 10 zeigen andererseits experimentelle Ergebnisse über die Verteilung der zugeordneten Bit für die LUT-Adresse mehrerer Bänder. Dieses ist ein Beispiel des statistischen Verteilungsergebnisses für 96 kBit/s der MPEG-Schicht II. Obwohl dieses Ergebnis nicht für alle Bänder gilt, ist ersichtlich, daß in der Schicht II die zugeordneten Bit für die Bänder 3, 4 und 5 für untere Adressen größer sind. Dabei bedeuten untere Adressen, daß die Größen der drei Charakteristiken alle groß sind. In Hinblick auf alle Bänder entsprechen kleinere Größen der drei Charakteristiken weniger zugeordneten Bit. Diese Erscheinung ist deutlicher für die Bänder 3, 4 und 5.
  • 11 zeigt in einer graphischen Darstellung die Beziehung zwischen einem absoluten Schwellenwert, der von einem psychoakustischen Modell eines Menschen erhalten wird, und 32 Bändern. Eine Menge Bit wird dem am empfindlichsten hörbaren Bereich, d. h. den Bändern 3, 4 und 5, zugeordnet, die 2 kHz–4 kHz entsprechen, wo der absolute Schwellenwert am niedrigsten ist, so daß eine saubere Tonqualität erhalten werden kann.
  • Um den Speicher effizienter auszunutzen, indem die Gesamtgröße der in dieser Weise gebildeten Nachschlagtabelle LUT verringert wird, wird gemäß der Erfindung zusätzlich eine LUT-Optimierung durchgeführt. Das heißt mit anderen Worten, daß die Adresse, deren zugeordnete Bit-Menge, die als Eingangswert der LUT gespeichert ist, gleich Null ist, von der LUT ausgeschlossen wird, wodurch die Größe der LUT stark verringert wird. Da beispielsweise im Falle des Bandes 31 in Tabelle 3 0 Bit am häufigsten den Adressen 0 und 32767 zugeordnet ist, werden diese Adressen nicht in die Tabelle der entsprechenden Bänder eingegeben. Wenn bei der Verwen dung einer in dieser Weise optimierten Nachschlagtabelle LUT beim Codierungsprozeß die durch die obigen drei Charakteristiken bestimmte Adresse in der LUT nicht vorhanden ist, dann wird dem Band 0 Bit zugeordnet. Die LUT speichert dementsprechend auch die Adresse, die durch die drei Charakteristiken mit einer zugeordneten Bit-Menge gebildet werden kann.
  • Im folgenden wird die Toncodierung unter Verwendung der vorbereiteten Nachschlagtabelle LUT beschrieben.
  • 12 zeigt das Blockschaltbild der erfindungsgemäßen digitalen Toncodiervorrichtung, die eine Nachschlagtabelle verwendet, wobei diese Vorrichtung einen Frequenzabbildungsteil 121, einen Charakteristikgewinnungsteil 123, eine Nachschlagtabelle 125 und einen Bit-Zuordnungs- und Quantisierungsteil 127 und einen Datenblockbildungsteil 129 umfaßt.
  • Im folgenden wird anhand von 12 die Arbeitsweise der erfindungsgemäßen digitalen Toncodiervorrichtung beschrieben, die eine Nachschlagtabelle verwendet. Zunächst werden die Tondaten über das Bandanalysefilter im Frequenzabbildungsteil 121 geführt, um die Tondaten in 32 Frequenzbänder aufzuteilen. Dann bestehen 12 Samples in jedem Band im Fall der Schicht I und 36 Samples im Fall der Schicht II jeweils.
  • Um die Adresse der Nachschlagtabelle LUT 125 zu erhalten, berechnet der Charakteristikgewinnungsteil 123 drei Charakteristiken, nämlich die Varianz, die mittlere Quadratwurzel und den Skalenfaktor für ein Eingangssignal jedes Bandes nach dem oben beschriebenen Verfahren und sortiert der Teil 123 diese Charakteristiken in der Reihenfolge ihrer Größe.
  • Der Bit-Zuordnungs- und Quantisierungsteil 127 ordnet Bit für jedes Band unter Verwendung der nach dem obigen Verfahren gebildeten Nachschlagtabelle LUT 125 zu und ver gleicht dann die zugeordnete Bit-Zahl mit der Anzahl der erforderlichen Bit, um zu prüfen, ob es ein Rest-Bit gibt oder nicht. Wenn die Bit durch die Nachschlagtabelle LUT 125 zugeordnet werden, ist es natürlich wünschenswert, die Bit so zuzuordnen, daß die Anzahl der erforderlichen Bit getroffen wird. Da eine begleitende Einstellung nicht erforderlich ist, kann die Prozeßgeschwindigkeit bezeichnend herabgesetzt werden.
  • Zunächst werden die Bit durch die Nachschlagtabelle LUT 125 zugeordnet. Wenn die Anzahl der zugeordneten Bit die erforderlichen Bit überschreitet, dann wird die Anzahl an Bit des Bandes, dem die meisten Bit zugeordnet werden, um 1 Bit herabgesetzt, was dann mit der Anzahl der erforderlichen Bit für alle Bänder verglichen wird. Dieser Vorgang wird wiederholt durchgeführt, bis die zugeordneten Bit die erforderlichen Bit nicht überschreiten.
  • Wenn nach der Zuordnung der Bit unter Verwendung der Nachschlagtabelle LUT 125 im Gegensatz dazu die zugeordneten Bit weniger als die erforderlichen Bit sind, so daß zusätzliche Bit zugeordnet werden können, dann wird folgender Arbeitsvorgang ausgeführt. Ein Zuwachsband bedeutet ein Band, an dem die Anzahl der Bit zu erhöhen ist. Ein Satz bedeutet eine Liste zum getrennten Speichern eines derartigen Zuwachsbandes. Der im folgenden gegebene Algorithmus ist ein Beispiel für die Schicht I. In einem ersten Schritt wird ein Anfangswert eines Kennzeichens auf Null gesetzt und wird der Inhalt des Satzes auf 1 initialisiert. In einem zweiten Schritt wird ein Band mit größtem Skalenfaktor gesucht. Wenn das gesuchte Band im Satz nicht enthalten ist, wird das Band als Zuwachsband festgelegt und wird das Kennzeichen in 1 geändert. Im dritten Schritt wird das Zuwachsband im Satz gespeichert, wenn das Kennzeichen gleich 1 ist. Wenn das Kennzeichen gleich Null ist, bedeutet das gleichfalls, daß alle Bänder im Satz gespeichert sind, was weiterhin bedeutet, daß alle Bänder Zuwachsbänder sind. In diesem Fall werden die Zuwachsbänder wiederum in der Reihenfolge ihrer Speicherung im Satz bezeichnet. Das heißt mit anderen Worten, daß das Zuwachsband erneut in der Reihenfolge der größeren Skalenfaktoren bezeichnet wird, bis die Anzahl der erforderlichen Bit erfüllt ist. In einem vierten Schritt wird die Anzahl der Bit in einem Zuwachsband um 1 Bit erhöht. Wenn die Anzahl der zugeordneten Bit für das laufende Zuwachsband gleich 1 ist, dann wird in einem fünften Schritt die Anzahl der zugeordneten Bit mit den erforderlichen Bit erneut verglichen. Wenn die Bitzahl 30 nicht überschreitet, wird die Anzahl der Bit des Zuwachsbandes um 1 erhöht und wird die Menge der benutzten Bit berechnet, woraufhin der Arbeitsvorgang zum ersten Schritt zurückkehrt. Wenn die Anzahl der zugeordneten Bit des aktuellen Zuwachsbandes nicht gleich 1 ist, dann wird die Menge der benutzten Bit nur berechnet, und geht der Arbeitsvorgang dann auf den ersten Schritt zurück. 30 ist als Standardwert festgelegt, da insgesamt 30 Bit notwendig sind. Da die Anzahl an Bit des Bandes, dem als erstem Bit zugeordnet wurden, um 2 Bit und nicht um 1 Bit erhöht werden sollte, bedeutet das, daß 24 Bit den 12 Samples zugeordnet werden und die Skalenfaktorinformation 6 Bit umfaßt. Andererseits wird ein Skalenfaktor als Standard des Zuwachsbandes im zweiten Schritt benutzt. Es kann jedoch auch eine andere Charakteristik, wie beispielsweise die Varianz oder die mittlere Quadratwurzel, benutzt werden. Da bei der Schicht II drei Skalenfaktoren in jedem Band vorhanden sind, wird der größte Skalenfaktor als Standard benutzt.
  • Der Bit-Einstellungsvorgang beeinflußt stark die Verringerung der gesamten Arbeitszeit, die für die Toncodierung notwendig ist. Da die Anzahl an Wiederholungen des Bit-Ein stellungsvorganges dadurch verringert werden kann, daß die zugeordneten Bit unter Verwendung der Nachschlagtabelle LUT 125 richtig zu den erforderlichen Bit passen, sollte mit anderen Worten die Nachschlagtabelle LUT 125 richtig und zuverlässig gebildet werden.
  • In der Praxis wurden zur Prüfung der Arbeitseffektivität der vorliegenden Erfindung Gesamtbetriebszeiten für zwölf Tondaten gemessen. Als experimentelle Unterstützung wurde ein SUN SPARC-10 unter einem UNIX-System verwandt. Die Tondaten wurden von einer CD erhalten. Die folgende Tabelle 4 gibt die Arbeitszeit der Codiervorrichtung wieder, wobei Codierverfahren mit einer Nachschlagtabelle LUT, wie es von der vorliegenden Erfindung vorgeschlagen wird, und bei Benutzung des bestehenden MPEG-Algorithmus in ihrer Leistungsfähigkeit verglichen wurden. Tabelle 4
    Nummer Daten MPEG (1/60 s) LUT (1/60 s) Verbesserung der Leistungsfähigkeit (%)
    1 harpsi 13763 7836 43.0
    2 jongseo 16901 10079 40.4
    3 kenny 22579 12797 43.3
    4 man 12677 7536 40.6
    5 newyork 19787 11140 43.7
    6 paul 19429 10948 43.7
    7 sorpa 12697 7484 41.1
    8 suhee 18728 10966 41.4
    9 tri 12823 8310 35.2
    10 vivaldi 14059 8241 41.4
    11 whitney 18688 11151 40.3
    12 woman 12084 7345 39.2
    Mittelwert 16184 9486 41.4
  • In der obigen Tabelle 4 sind alle zwölf Tondaten durch einen bestimmten Namen gegeben, wobei die Nummer den tatsächlichen Ausführungszeitpunkt bezeichnet und die Verbesserung in der Leistungsfähigkeit (Eimp) nach der folgenden Gleichung (4) erhalten wurde:
    Figure 00230001
    wobei Eimp die Verbesserung der Leistungsfähigkeit bezeichnet, TMPEG die Arbeitszeit des MPEG-Algorithmus ist und TLUT die des Algorithmus ist, der durch die vorliegenden Erfindung vorgeschlagen wird.
  • Bei dem zweiten Ausführungsbeispiel der vorliegenden Erfindung sind die von dem psychoakustischen Modell abhängigen Charakteristiken als Skalenfaktor und Quadratmittelwert vorgeschrieben.
  • Der Endausgangswert des psychoakustischen Modells 33 ist ein SMR-Wert, der den Unterschied zwischen einem Signalpegel und einem Maskierungspegel für jedes Band wiedergibt. Um diesen Wert zu erhalten, wird zunächst der Signalpegel berechnet. Für das psychoakustische Modell 33 wird der Signalpegel jedes Bandes als größerer Wert der Leistung für das relevante Band genommen und wird das Leistungsspektrum sfmax des Skalenfaktors festgelegt, was sich schreiben läßt Lsb(n) = MAX[power(n), 20log(sfmax(n)·32768) – 10]dB (5)wobei Lsb(n) der Schalldruck für ein Band n ist, was einem Pegel S für SMR entspricht.
  • In der obigen Gleichung (5) ist der Faktor zum Bestimmen des Signalpegels für jedes Band ein Skalenfaktor und ein Leistungswert. Im psychoakustischen Modell wird die Leistung über eine Frequenzumwandlung erhalten, die jedoch in Hinblick auf den Zeitbereich analogisiert wird, um als Quadratmittelwert der Samplewerte für jedes Band erhalten zu werden, nachdem das Bandanalysefilter passiert ist. Der Skalenfaktor, der der größte Samplewert in jedem Band ist, wird jedoch direkt im Zeitbereich erhalten.
  • Wenn im allgemeinen die Leistung eines Tonsignals groß ist, sollten mehr Bit zugeordnet werden. Es wird daher in Betracht gezogen, die Leistung in Hinblick auf den Frequenzbereich durch die Größe der Samplewerte im Zeitbereich zu bestimmen. Wenn das berücksichtigt wird, hat der Skalenfaktor als größter Wert in jedem Band eine Beziehung zur Leistung und bestimmt der Skalenfaktor die zugeordnete Bit-Menge.
  • Bei der Bildung der Nachschlagtabelle LUT unter Verwendung der oben beschriebenen Charakteristiken der Tonsignale ist der wichtigste bestimmende Faktor die Art der Verwendung dieser Charakteristiken beim Lokalisieren der Adressen der Nachschlagtabelle LUT. Das Verfahren der Bildung der Nachschlagtabelle LUT unter Verwendung dieser beiden Charakteristiken, d. h. des Skalenfaktors und des quadratischen Mittelwertes, wird im folgenden beschrieben.
  • Die Nachschlagtabelle LUT, in der die Adresse für jedes Band und die zugeordnete Bit-Menge gespeichert sind, wird dazu benutzt, die für die Bit-Zuordnung benötigte Zeit zu verkürzen. Das heißt mit anderen Worten, daß die Adressen, die durch die beiden Parameter bestimmt sind, in der Nachschlagtabelle LUT aufgesucht werden, um Bit dem relevanten Band zuzuordnen. Bei dem MPEG-Zuordnungsverfahren wird die Bit-Anzahl nacheinander um 1 erhöht, und zwar ausgehend von dem Band, das den größten SMR-Wert für alle Bänder hat, der vom psychoakustischen Modell erhalten wird, wobei relative SMR-Werte in einem Block unter Berücksichtigung der Korrela tivität für jedes Band verarbeitet werden. Zum Bilden der Adressen in der Nachschlagtabelle LUT wird gemäß der Erfindung das Konzept einer Besetzungszahl oder Besetzungsrate eingeführt, um den relativen Wert des Skalenfaktors und des quadratischen Mittelwertes für jedes Band zu erhalten.
  • Die Besetzungsrate SRef(n) für den Skalenfaktor eines Bandes n ist ein Wert, der dadurch erhalten wird, daß der Skalenfaktor sf(n) des Bandes n durch die Summe der Skalenfaktoren sf aller Bänder geteilt wird, was sich schreiben laßt als:
    Figure 00250001
  • Die Besetzungsrate SRpwr = (n) für den quadratischen Mittelwert des Bandes n ist ein Wert, der dadurch erhalten wird, daß der quadratische Mittelwert pwr(n) des Bandes n durch die Summe der quadratischen Mittelwerte aller Bänder geteilt wird, was sich schreiben läßt als:
    Figure 00250002
  • Dabei geben alle Bänder beide Kanäle wieder, die für einen Verbundstereobetrieb oder Joint-Stereo-Betrieb vorgesehen sind. Die Besetzungsrate ist ein Index, der anzeigt, wie stark der Wert eines Bandes in allen Bändern besetzt ist. Die Besetzungsrate ist somit ein relativer Wert unter Berücksichtigung aller Werte und ähnelt dem Konzept der wiederholten Bit-Zuordnungsschleifen der MPEG.
  • Ein größerer Wert des in dieser Weise erhaltenen Skalenfaktors für jedes Band und der Besetzungsrate des quadra tischen Mittelwertes wird dann ausgewählt, um bei der Bildung der Adresse des relevanten Bandes verwandt zu werden. Der Grund dafür besteht darin, daß zwar diese beiden Charakteristiken beim Berechnen der Adressen aller Nachschlagtabelien LUT verwandt werden können, die Adressen aber größer werden, was dazu führt, daß die Gesamtgröße der Nachschlagtabelle LUT größer wird. Ein dem psychoakustischen Modell ähnlicher Arbeitsvorgang, bei dem in der durch die Gleichung (5) oben angegebenen Weise von den beiden Werten der größere Wert als Signalpegel des relevanten Bandes festgelegt wird, wird gleichfalls gemäß der Erfindung ausgeführt.
  • Die Besetzungsraten sind alle kleiner als 1, wobei diese Werte in ganze Zahlen gemäß der Erfindung unter Verwendung von Skalenfaktorumsetzungsdaten in 63 Stufen umgewandelt werden und dann die Adressen der Nachschlagtabelle LUT zugeordnet werden. In diesem Fall ist die Adresse mit dem größten Wert für die jeweiligen Bänder gleich 62.
  • Nachdem die endgültigen Besetzungsraten für jedes Band erhalten sind, werden die zugeordneten Bit-Mengen, die diesen Werten entsprechen, unter Verwendung von soviel Tondaten wie möglich gesucht und dann in der Nachschlagtabelle LUT gespeichert. Das heißt mit anderen Worten, daß die zugeordneten Bit-Mengen über die Tondaten gesucht werden, die durch den MPEG-Algorithmus unter Verwendung des psychoakustischen Modells gewählt sind. Dabei werden die Besetzungsraten für jedes Band erhalten, um dann die am meisten besetzten Bit als entsprechende Bit der Besetzungsraten zu bestimmen. 3 zeigt das Verfahren der Bildung der Nachschlagtabelle LUT.
  • Wenn bezüglich eines Bandes beispielsweise angenommen wird, daß die zugeordnete Bit-Menge durch das psychoakustische Modell gleich 7 beim Band 0 ist, und daß die Besetzungsrate dort gleich 5 ist, dann wird die Frequenzzahl um eins im 7-Bit-Bereich der Adresse 5 erhöht. Ein derartiger Vorgang wird wiederholt bezüglich der verschiedenen Arten von Tonsignalen ausgeführt, um dann den häufigsten Wert als die zugeordnete Bit-Menge des relevanten Bandes festzulegen.
  • Wie es in der folgenden Tabelle 5 angegeben ist, werden 8, 7, 0 und 0 als endgültige zugeordnete Bit-Menge der Adressen 5, 30, 61 und 62 bestimmt. Wenn die Anzahl der häufigsten Bänder gleich 2 ist, wird das obere Bit gewählt. Tabelle 5
    Adresse 0 1 ... 7 8 ... 15 16
    ... ... .. ... ... ... ... ... ...
    5 2 34 ... 1300 6543 ... 189 89
    30 5 34 ... 5656 787 ... 689 560
    31 ... ...
    ...
    61 5655 3417 ... 45 5 ... 0 0
    62 6789 4562 ... 5 8 ... 0 0
  • Die in dieser Weise erhaltene Nachschlagtabelle LUT speichert 1984 Arten von Informationen insgesamt, d. h. jeweils 62 für 32 Bänder. Das ist eine sehr große Datenmenge von etwa 25 kByte, so daß ein Optimierungsvorgang zusätzlich vorgesehen wird, um den Speicher wirksamer auszunutzen, so daß dessen Gesamtgröße verringert werden kann. Ähnlich wie die Adressen 61 und 62 der Tabelle 5 werden Adressen, bei denen die endgültig zugeordnete Bit-Menge gleich Null ist, somit in der Nachschlagtabelle LUT nicht gespeichert. Wenn weiterhin die zugeordneten Bit-Mengen aufeinander folgende Adressen gleich sind, wird nur die zugeordnete Bit-Menge der Adresse mit einem kleineren Wert in der Nachschlagtabelle LUT gespeichert. Dadurch wird nur die Adresse an der Grenze, an der die Bit-Werte geändert werden, als Information benutzt. Eine derartige Optimierung setzt stark die notwendige Kapazität des Speichers zum Speichern der Nachschlagtabellen LUT herab.
  • Im folgenden wird anhand von 12 das Toncodierungsverfahren mit der in dieser Weise gebildeten Nachschlagtabelle LUT beschrieben.
  • Um eine Adresse der LUT 125 zu erhalten, berechnet der Charakteristikgewinnungsteil 123 Besetzungsraten für den Skalenfaktor und den quadratischen Mittelwert bei einem Eingangssignal für jedes Band nach dem oben beschriebenen Verfahren und wählt der Teil 123 den größten Wert, um diesen als Adresse der Nachschlagtabelle LUT 125 festzulegen.
  • Der Bit-Zuordnungs- und Quantisierungsteil 127 ordnet die Bit für jedes Band unter Verwendung der nach dem oben beschriebenen Verfahren erhaltenen Nachschlagtabelle LUT 125 zu und vergleicht dann die zugeordnete Bit-Zahl mit der Anzahl der erforderlichen Bit, um zu prüfen, ob ein Rest-Bit bleibt oder nicht, wodurch die gesamte nutzbare Bit-Menge eingestellt wird. Wenn die Bit durch die Nachschlagtabelle LUT 125 zugeordnet werden, ist es natürlich wünschenswert, Bit so zuzuordnen, daß die Anzahl der erforderlichen Bit getroffen wird. Da eine begleitende Einstellarbeit nicht notwendig ist, kann die Arbeitszeit beträchtlich herabgesetzt werden.
  • Zuerst werden Bit durch die Nachschlagtabelle LUT 125 zugeordnet. Im folgenden wird die Arbeitsweise für den Fall beschrieben, daß die erforderlichen Bit überschritten werden. Wenn die zugeordneten Bit die erforderlichen Bit überschreiten, wird die Anzahl an Bit des Bandes, dem die meisten Bit zugeordnet sind, um 1 Bit herabgesetzt, und zwar ausgehend von dem Band, dem 1 Bit mehr zugeordnet ist, während es die kleinste Besetzungsrate hat. Dieses Verfahren wird solange wiederholt, bis die Anzahl der zugeordneten Bit die erforderlichen Bit nicht überschreitet. Zu diesem Zeit- Punkt wird das einmal reduzierte Band mit der niedrigsten Priorität versehen, so daß die Bit gleichmäßig für alle Bänder reduziert werden. Die Bit-Abnahme beginnt von den höheren Bändern, da die wichtige Information im allgemeinen stark am unteren Frequenzbereich konzentriert ist.
  • Wenn im Gegensatz dazu nach dem Zuordnen der Bit unter Verwendung der Nachschlagtabelle LUT 125 die Anzahl der zugeordneten Bit kleiner als die der erforderlichen Bit ist, so daß zusätzliche Bit zugeordnet werden können, werden die unteren Bänder aufgesucht und wird dann die Bit-Zahl immer um 1 von dem Band aus erhöht, das die maximale zugeordnete Bit-Menge nicht überschreitet, während es die größte Besetzungsrate hat. Dieser Arbeitsvorgang wird wiederholt, solange die Zahl der zugeordneten Bit die erforderliche Bit-Anzahl nicht überschreitet.
  • Der Bit-Einstellungsvorgang beeinflußt stark die Verringerung der Gesamtarbeitszeit, die für die Toncodierung notwendig ist. Da die Anzahl der Wiederholungen des Bit-Einstellungsvorganges dadurch verringert wird, daß die zugeordneten Bit unter Verwendung der Nachschlagtabelle LUT 125 richtig zu den erforderlichen Bit passen, sollte daher die Nachschlagtabelle 125 richtig und zuverlässig gebildet werden.
  • Es wurde in der Zwischenzeit eine Verbundstereoarbeitsweise aus den menschlichen psychoakustischen Charakteristiken eingeführt, die allgemein die Tatsache verwendet, daß, je höher die Frequenz ist, umso schlechter die Fähigkeit der genauen Erfassung der Position einer Tonquelle wird. Die Kompliziertheit der Hardware der Verbundstereoarbeitsweise ist im allgemeinen die gleiche wie die der Stereocodierungsarbeitsweise. Die Verzögerungszeit der Verbundstereoarbeitsweise wird kaum geändert, verglichen mit dem der Stereocodierarbeitsweise. Der Hauptzweck dieser Arbeitsweise be steht darin, die Tonqualität zu erhöhen und zu codieren, wodurch die Bit-Übertragungsgeschwindigkeit auf etwa 10 bis 30 kBit/s herabgesetzt wird.
  • Das Verbundstereocodierverfahren, das im MPEG-Tonteil standardisiert ist, wird im folgenden beschrieben, wobei ein bestimmtes Band bestimmt wird und Samples nicht in Bändern jenseits des bestimmten Bandes codiert werden, deren Summe jedoch gebildet wird, um nur ein Sample zu codieren. Der Umfang des bestimmten Bandes, der nach dem Verbundstereocodierverfahren zu codieren ist, wird dadurch bestimmt, daß über die zugeordnete Bit-Menge entschieden wird, um das Rauschen jedes Bandes auf einen Maskenpegel oder darunter herabzusetzen, zu prüfen, ob die zugeordneten Bit die erforderlichen Bit übersteigen und dann eines der vier Bänder (4, 8, 12 und 16) zu wählen. In dem in dieser Weise bestimmten Verbundstereoband wird die größerer zugeordnete Bit-Menge des linken und rechten Kanals gewählt, um dann quantisiert zu werden.
  • Beim Codieren unter Anwendung derartiger Konzepte auf die Nachschlagtabelle LUT der vorliegenden Erfindung ist es wichtig, den durch das Verbundsterocodierverfahren zu codierenden Bereich der Bänder zu bestimmen. Bei der vorliegenden Erfindung werden die Besetzungsraten für jedes Band aufgesucht und wird dann geprüft, wieviele Bänder 99% in der Summe der Besetzungsraten unter allen Bändern überschreiten. In den nach dem Verbundstereocodierverfahren zu codierenden Bändern wird gleichfalls der größere Wert jedes Skalenfaktors und jedes quadratischen Mittelwertes für den linken und den rechten Kanal gewählt, um bei der Bildung der Besetzungsrate benutzt zu werden.
  • Da die Summe aller Bänder kleiner als beim Stereocodierverfahren wird, werden bei der Bildung der jeweiligen Besetzungsraten diese größer als es beim Stereocodierver fahren der Fall ist. Da verschiedene Adressen berechnet werden, wird im Fall der Codierung nach dem Verbundstereocodierverfahren die zugeordnete Bit-Menge verschieden. Es ist daher sowohl eine Codierung mit dem Stereocodierverfahren als auch mit dem Verbundstereocodierverfahren unter Verwendung einer einzigen Nachschlagtabelle LUT möglich.
  • Um die Leistungsfähigkeit der vorliegenden Erfindung zu prüfen, wurden in der Praxis die Gesamtarbeitszeiten für zwölf Tondaten gemessen. Als Versuchsunterstützung wurde ein SUN SPARC-10 unter einem UNIX-System verwandt. Die Tondaten wurden von einer CD erhalten.
  • Die folgende Tabelle 6 gibt die Arbeitszeit der Codiervorrichtung wieder, wobei das Codierverfahren unter Verwendung einer Nachschlagtabelle LUT, wie es von der vorliegenden Erfindung vorgeschlagen wird, und das Verfahren unter Verwendung des bestehenden MPEG-Algorithmus in ihrer Leistungsfähigkeit verglichen wurden. Tabelle 6
    Nummer Daten MPEG (1/60 s) LUT (1/60 s) Verbesserung der Leistungsfähigkeit (%)
    1 abba 19037 11895 37.5
    2 ensemble 10636 10079 32.4
    3 glockenspiel1 18234 12797 36.3
    4 glockenspiel2 12957 7536 40.1
    5 gpiano1 11486 11140 35.3
    6 gpiano2 25753 10948 34.7
    7 gpiano3 43178 7484 47.1
    8 gpiano4 22878 10966 49.9
    9 orchestra 44412 8310 49.9
    10 tri1 37654 8241 52.2
    11 1 tri2 27692 11151 49.2
    Mittelwert 24902 13866 44.3
  • In der obigen Tabelle 6 sind die zwölf Tondaten jeweils über einen bestimmten Namen gegeben, gibt die Nummer den tatsächlichen Ausführungszeitpunkt wieder und wird die Verbesserung der Leistungsfähigkeit Eimp nach der obigen Gleichung (4) erhalten.
  • Zunächst wird die Arbeitsgeschwindigkeit des Algorithmus beschrieben, der durch die vorliegende Erfindung vorgeschlagen wird. Wie es in der Tabelle 4 und in der Tabelle 6 angegeben ist, versteht es sich, daß trotz eines kleinen Unterschiedes in Abhängigkeit von den Tondaten eine Geschwindigkeitsverbesserung von etwa 41,4% und 44,3% bei dem ersten und dem zweiten Ausführungsbeispiel verglichen jeweils mit dem bestehenden Verfahren erzielt werden kann. Das bedeutet auch eine Verbesserung in der Echtzeitverarbeitung der Codiervorrichtung. Die Arbeitsverzögerung in der Codiervorrichtung wird durch eine Hardwareausführung verringert. Das Bit-Zuordnungsverfahren, daß durch die vorliegende Erfindung vorgeschlagen wird, wird jedoch nicht nur durch die Nachschlagtabelle LUT, sondern auch durch einen folgenden Arbeitsvorgang, d. h. einen Schritt der Verarbeitung zusätzlicher oder fehlender Bit (ein Bit-Einstellschritt) verwirklicht. Die Gesamtarbeitszeit kann entsprechend dem Bit-Einstellschritt herabgesetzt werden.
  • In Hinblick auf die Tonqualität eines Tonsignals ist das nahezu das gleiche wie beim bestehenden MPEG-Algorithmus. Das heißt mit anderen Worten, daß in der Schicht I die CD-Tonqualität, die nahezu gleich dem Originalton ist, bis zu einer Grenze von 128 kBit/s und bis zu 96 kBit/s in der Schicht II erhalten werden kann.
  • Um andererseits den Unterschied in der Leistungsfähig keit zwischen dem Algorithmus, der durch die vorliegende Erfindung vorgeschlagen wird, und dem herkömmlichen MPEG-Algorithmus zu finden, wird ein Bewertungsverfahren unter Verwendung des psychoakustischen Modells verwandt, das von Karlheinz Brandenburg vorgeschlagen wurde. Dieses Verfahren verwendet einen MNR-Wert als Standardmessung. Wenn der NMR-Wert negativ ist, dann liegt das Rauschen unter einem Maskenpegel. Das Rauschen ist dann so gering, daß ein Tonsignal mit störungsfreier Tonqualität wiedergegeben wird.
  • Die 13 und 14 zeigen graphische Darstellungen zum Vergleich des Bewertungsergebnisses für zwei Algorithmen für die jeweiligen Kanäle, wobei sich zeigt, daß das Verfahren unter Verwendung der Nachschlagtabelle LUT unempfindlicher gegenüber Störungen für den niederfrequenten Bereich als das MPEG-Verfahren ist. Selbst wenn die erforderlichen Bit gleich sind, ist mit anderen Worten der Einsatz der Bit beim Codierungsverfahren unter Verwendung einer Nachschlagtabelle LUT wirkungsvoller als beim herkömmlichen Verfahren.
  • Da in der oben beschriebenen Weise ein psychoakustisches Modell beim digitalen Toncodierungsverfahren und bei der digitalen Toncodierungsvorrichtung unter Verwendung einer Nachschlagtabelle gemäß der vorliegenden Erfindung nicht benutzt wird, ist die Möglichkeit einer Echtzeitverarbeitung durch eine entsprechende Hardwareausführung erhöht, wobei die Arbeitszeitverzögerung in der Codiervorrichtung stark verringert ist. Ein tatsächliches Anwendungsbeispiel ist die Hardware für einen Unterhaltungscomputer. Obwohl die Tonqualität in diesem Fall nicht so wichtig ist, sind das erfindungsgemäße digitale Toncodierungsverfahren und die erfindungsgemäße digitale Toncodierungsvorrichtung unter Verwendung einer Nachschlagtabelle sehr nützlich, da dabei ein schnelles Echtzeitarbeiten in starkem Maße erforderlich ist.
  • In einer tatsächlichen Hardware ist das psychoakustische Modell aufgrund seiner komplizierten Algorithmen schwierig zu verwirklichen. Gemäß der Erfindung wird statt des psychoakustischen Modells als größter Einflußfaktor, der die Funktion der Codiervorrichtung bestimmt, eine Nachschlagtabelle LUT verwandt. Die Hardware kann daher problemlos ausgeführt werden, indem nur zusätzlich ein Speicher zugefügt wird, was auch die Kosten der Codiervorrichtung verringert.
  • Da gemäß der Erfindung, verglichen mit der bestehenden MPEG-Codiervorrichtung, ein Chip mit sehr verringerter Größe erzielt wird, kann die vorliegende Erfindung auf kleine Geräte, wie beispielsweise tragbare Kameras usw., angewandt werden. Gegenwärtig ist es üblich, MPEG-Chips in Computer einzubauen. Die Vorrichtung gemäß der vorliegenden Erfindung ist somit vollständig mit der MPEG-Vorrichtung kompatibel, die Größe der in den Computer eingebauten Platte kann jedoch verringert werden, was es möglich macht, leichte, flache, kurze und kleine Produkte herzustellen.

Claims (15)

  1. Digitales Tonkodierverfahren, welches folgende Schritte umfasst: Teilen eines Tonsignals im Zeitbereich in eine Anzahl von Frequenzbändern gleicher Breite; Bestimmen einer Anzahl zugeordneter Bits für jedes Frequenzband, wobei das Bestimmen beinhaltet: Berechnen einer Varianz, einer mittleren Quadratwurzel und eines Skalenfaktors für jedes Frequenzband, Bestimmen von Reihenfolge-Nummern für die Varianz, die mittlere Quadratwurzel und den Skalenfaktor für jedes Frequenzband gemäß den relativen Größen der Varianzen, der mittleren Quadratwurzeln und der Skalenfaktoren aller Frequenzbänder, Berechnen einer Adresse für jedes Frequenzband beruhend auf den Reihenfolge-Nummern, und Extrahieren der Anzahl zugeordneter Bits aus einer Nachschlagtabelle unter Verwendung der für jedes Frequenzband berechneten Adresse; Zuordnen der Bits zu jedem Frequenzband entsprechend der extrahierten Anzahl zugeordneter Bits und Quantisieren der zugeordneten Bits; Bilden eines quantisierten Tonsignals als einen Bitstrom aus den quantisierten Bits.
  2. Verfahren gemäß Anspruch 1, weiterhin umfassend das Erzeugen der Nachschlagtabelle, wobei das Erzeugen beinhaltet: a) Teilen eines Testtonsignals im Zeitbereich in die Anzahl von Frequenzbändern; b) Berechnen einer Varianz, einer mittleren Quadratwurzel und eines Skalenfaktors für jedes Frequenzband; c) Bestimmen von Reihenfolge-Nummern für die Varianz, die mittlere Quadratwurzel und den Skalenfaktor für jedes Frequenzband gemäß den relativen Größen der Varianzen, der mittleren Quadratwurzeln und der Skalenfaktoren aller Frequenzbänder des Testtonsignals; d) Bestimmen einer zugeordneten Bitanzahl für jedes Frequenzband unter Verwendung eines psychoakustischen Modells; e) Berechnen einer Adresse entsprechend jeder Reihenfolge-Nummer; f) Speichern der zugeordneten Bitanzahl für jedes Frequenzband an der Adresse, die der Reihenfolge-Nummer für jedes Frequenzband entspricht; g) Wiederholen der Schritte a) bis f) für eine Vielzahl von Testtonsignalen und Speichern einer Vielzahl zugeordneter Bitanzahlen an jeder Adresse; h) Erzeugen der Nachschlagtabelle durch Speichern jeder Adresse und der am häufigsten bei jeder Adresse auftretenden zugeordneten Bitanzahl; und i) Ausschließen von Adressen, die eine zugeordnete Bitanzahl von Null aufweisen, aus der Nachschlagtabelle und Zuordnen eines Nullbits zu den aus der Nachschlagtabelle ausgeschlossenen Adressen, wodurch die Bitzuordnung optimiert wird.
  3. Verfahren gemäß Anspruch 1, weiterhin umfassend: Vergleichen einer Anzahl benötigter Bits mit einer Anzahl tatsächlich zugeordneter Bits, nach dem Zuordnen der Bits unter Verwendung der Nachschlagtabelle und Anpassen der zugeordneten Bits gemäß dem Vergleichsergebnis.
  4. Digitales Toncodierverfahren umfassend die Schritte: Teilen eines Stereotonsignals im Zeitbereich in eine Anzahl von Frequenzbändern gleicher Breite; Bestimmen einer Anzahl zugeordneter Bits für jedes Frequenzband, wobei das Bestimmen beinhaltet: Berechnen eines Skalenfaktors und eines quadratischen Mittelwertes für jedes Frequenzband, Bestimmen von Besetzungsraten für den Skalenfaktor und den quadratischen Mittelwert für jedes Frequenzband und Vergleichen der Besetzungsraten für jedes Frequenzband und Verwenden der größeren Besetzungsrate zur Berechnung einer Adresse für jedes Frequenzband, Extrahieren der zugeordneten Bitanzahl aus einer vorher vorbereiteten Nachschlagtabelle unter Verwendung der für jedes Frequenzband berechneten Adresse; Zuordnen von Bits, die der extrahierten zugeordneten Bitanzahlen für die Frequenzbänder entsprechen, und Quantisieren der zugeordneten Bits; Vergleichen einer Anzahl benötigter Bits mit einer Anzahl von tatsächlich zugeordneten Bits nach Zuordnen der Bits unter Verwendung der Nachschlagtabelle und Anpassen der zugeordneten Bits gemäß dem Vergleichsergebnis; und Bilden eines quantisierten Tonsignals als einen Bitstrom aus den quantisierten Bits.
  5. Verfahren gemäß Anspruch 4, weiterhin umfassend das Erzeugen der Nachschlagtabelle, welches beinhaltet: a) Teilen eines Testtonsignals in eine Vielzahl von Frequenzbändern; b) Berechnen eines Skalenfaktors und eines quadratischen Mittelwertes für jedes Frequenzband; c) Berechnen von Besetzungsraten entsprechend dem Skalenfaktor und dem quadratischen Mittelwert für jedes Frequenzband; d) Vergleichen der Besetzungsraten für jedes Frequenzband und Berechnen einer Adresse für jedes Frequenzband beruhend auf der größeren Besetzungsrate; e) Bestimmen einer zugeordneten Bitanzahl für jedes Frequenzband unter Verwendung eines psychoakustischen Modells; f) Speichern der zugeordneten Bitanzahl für jedes Frequenzband an der Adresse, die jedem Frequenzband entspricht; g) Wiederholen der Schritte a) bis f) und Speichern einer Vielzahl zugeordneter Bitanzahlen an jeder Adresse; h) Erzeugen der Nachschlagtabelle durch Speichern jeder Adresse und der Anzahl zugeordneter Bits, die an jeder Adresse am häufigsten auftritt; i) Ausschließen der Adressen, die eine zugeordnete Bitanzahl von Null aufweisen, aus der Nachschlagtabelle und Speichern nur eines Grenzabschnittes, an dem Grenzwerte geändert werden, wodurch die Bitzuordnung optimiert wird.
  6. Digitales Toncodierverfahren gemäß Anspruch 4 umfassend: Erhöhen der Anzahl zugeordneter Bits in 1-Bit-Schrittweiten, ausgehend von einem niedrigeren Frequenzband zu einem ersten Frequenzband, das eine größte Besetzungsrate aufweist, wenn eine geringere als eine benötigte Anzahl von Bits zugeordnet sind, und Verringern von Bits in 1-Bit-Schrittweiten, ausgehend von einem höheren Frequenzband zu einem zweiten Frequenzband, das eine kleinste Besetzungsrate aufweist, wenn mehr Bits als die benötigte Anzahl zugeordnet sind, wobei die Besetzungsrate für den Skalenfaktor durch Teilen des Skalenfaktors jedes Frequenzbandes durch die Summe der Skalenfakto ren aller Frequenzbänder und die Besetzungsrate für den quadratischen Mittelwert durch Teilen des quadratischen Mittelwertes jedes Frequenzbandes durch die Summe der quadratischen Mittelwerte aller Frequenzbänder gewonnen wird.
  7. Digitales Toncodierverfahren gemäß Anspruch 4, wobei die Adressen der Nachschlagtabelle unter Verwendung der Besetzungsrate des Skalenfaktors und des quadratischen Mittelwertes in jedem Frequenzband für alle Frequenzbänder berechnet werden, wobei die Besetzungsrate für den Skalenfaktor durch Teilen des Skalenfaktors jedes Frequenzbandes durch die Summe der Skalenfaktoren aller Frequenzbänder und die Besetzungsrate für den quadratischen Mittelwert durch Teilen des quadratischen Mittelwertes jedes Frequenzbandes durch die Summe der quadratischen Mittelwerte aller Frequenzbänder gewonnen wird.
  8. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass die Nachschlagtabelle, die im Stereobetrieb verwandt wird, ohne jede Änderung auch im Fall eines Verbundstereobetriebs verwandt wird.
  9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass die Grenze der Bänder, die durch den Verbundstereobetrieb zu codieren sind, dadurch örtlich festgelegt wird, dass die Besetzungsraten für jedes Band gebildet werden.
  10. Digitale Toncodiervorrichtung zur Codierung eines Tonsignals, welche umfasst: einen Frequenzabbildungsteil zur Teilung eines Tonsignals im Zeitbereich in eine erste Anzahl gleicher Frequenzbänder; eine Nachschlagtabelle beinhaltend zugeordnete Bitanzahlen zur Codierung eines Frequenzbandes, wobei die zugeordneten Bitanzahlen an Adressen gespeichert sind, die einer Größenreihenfolge von Charakteristiken des Frequenzbandes entsprechen, wobei die Charakteristiken eine Varianz, einen Skalenfaktor und eine mittlere Quadratwurzel beinhalten; einen Charakteristikgewinnungsteil zur Bestimmung der Adressen der Nachschlagtabelle gemäß der Größenreihenfolge der Charakteristiken des Tonsignals, wobei das Charakteristikgewinnungsteil umfasst: ein Berechnungsteil zur Berechnung der Charakteristiken jedes Frequenzbandes des Tonsignals, einen Bestimmungsteil zur Bestimmung von Reihenfolge-Nummern für jedes Frequenzband gemäß den relativen Größen der Charakteristiken jedes Frequenzbandes unter Bezug auf alle Frequenzbänder und einen Adressenberechnungsteil zur Berechnung einer Adresse zum Extrahieren einer zugeordneten Bitanzahl aus der Nachschlagtabelle beruhend auf den Reihenfolge-Nummern für die Charakteristiken jedes Frequenzbandes; einen Bitzuordnungs- und Quantisierungsteil zum Zuordnen von Bits, die den Adressen in der Nachschlagtabelle entsprechen, zu jedem Frequenzband und zum Quantisieren der zugeordneten Bits; und einen Datenblockbildungsteil zur Bildung eines quantisierten Tonsignals aus den quantisierten Bits als einen Bitstrom.
  11. Vorrichtung nach Anspruch 10, dadurch gekennzeichnet, dass die Adressen, deren zugeordnete Bitanzahl gleich Null ist, in der Nachschlagtabelle ausgeschlossen sind.
  12. Vorrichtung nach Anspruch 10, dadurch gekennzeichnet, dass der Bitzuordnungs- und Quantisierungsteil die Bitzuordnung dadurch optimiert, dass er 0 Bit den Adressen zuordnet, die in der Nachschlagtabelle nicht vorhanden sind.
  13. Vorrichtung nach Anspruch 10, dadurch gekennzeichnet, dass der Bitzuordnungs- und Quantisierungsteil die Anzahl der erforderlichen Bits mit der Anzahl der tatsächlich zugeordneten Bits nach der Bitzuordnung vergleicht und die Bitzuordnung nach Maßgabe des Vergleichsergebnisses nachstellt.
  14. Digitale Toncodiervorrichtung zur Codierung eines Tonsignals umfassend: einen Frequenzabbildungsteil zum Teilen eines Tonsignals im Zeitbereich in eine erste Anzahl gleicher Frequenzbänder; eine Nachschlagtabelle beinhaltend zugeordnete Bitanzahlen zur Kodierung eines Frequenzbandes, wobei die zugeordneten Bitanzahlen an Adressen gespeichert sind, die einer Größenreihenfolge von Charakteristiken des Frequenzbandes entsprechen, wobei die Charakteristiken einen Skalenfaktor und einen quadratischen Mittelwert beinhalten; einen Charakteristikgewinnungsteil zur Bestimmung der Adressen der Nachschlagtabelle gemäß der Größenreihenfolge der Charakteristiken des Tonsignals, wobei das Charakteristikgewinnungsteil beinhaltet: einen Berechnungsteil zur Berechnung der Charakteristiken jedes Frequenzbandes des Tonsignals, einen Bestimmungsteil zur Bestimmung von Reihenfolge-Nummern für jedes Frequenzband gemäß den relativen Größen der Charakteristiken des Frequenzbandes unter Bezug auf alle der Frequenzbänder, und einen Adressenberechnungsteil zur Berechnung einer Adresse zum Gewinnen einer zugeordneten Bitanzahl aus der Nachschlagtabelle, beruhend auf den Reihenfolge-Nummern für die Charakteristiken jedes Frequenzbandes; einen Bitzuordnungs- und Quantisierungsteil zum Zuordnen von Bits, die den Adressen in der Nachschlagetabelle entsprechen, zu jedem Frequenzband und zum Vergleichen einer Anzahl benötigter Bits mit einer Anzahl tatsächlich zugeordneter Bits, nachdem die Bits unter Verwendung der Nachschlagtabelle zugeordnet wurden, und zum Anpassen der zugeordneten Bits gemäß dem Vergleichsergebnis und zum Quantisieren der zugeordneten Bits; und einen Datenpaketbildungsteil zur Bildung eines quantisierten Tonsignals aus den quantisierten Bits als einen Bitstrom.
  15. Digitale Toncodiervorrichtung gemäß Anspruch 14, wobei die Adressen der Nachschlagtabelle unter Verwendung der Besetzungsrate des Skalenfaktors und des quadratischen Mittelwertes in jedem Frequenzband für alle Frequenzbänder berechnet werden, wobei die Besetzungsrate für den Skalenfaktor durch Teilen des Skalenfaktors jedes Frequenzbandes durch die Summe der Skalenfaktoren aller Frequenzbänder und die Besetzungsrate für die quadratischen Mittelwerte durch Teilen des quadratischen Mittelwertes jedes Frequenzbandes durch die Summe der quadratischen Mittelwerte aller Frequenzbänder gewonnen werden.
DE19638997A 1995-09-22 1996-09-23 Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung Expired - Lifetime DE19638997B4 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR1995-31355 1995-09-22
KR1019950031352A KR100300956B1 (ko) 1995-09-22 1995-09-22 룩업테이블을이용한디지탈오디오부호화방법및장치
KR1995-31352 1995-09-22
KR1019950031355A KR100300957B1 (ko) 1995-09-22 1995-09-22 룩업테이블을이용한디지탈오디오부호화방법및장치

Publications (2)

Publication Number Publication Date
DE19638997A1 DE19638997A1 (de) 1997-03-27
DE19638997B4 true DE19638997B4 (de) 2009-12-10

Family

ID=26631281

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19638997A Expired - Lifetime DE19638997B4 (de) 1995-09-22 1996-09-23 Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung

Country Status (3)

Country Link
US (1) US5864802A (de)
JP (1) JP3927627B2 (de)
DE (1) DE19638997B4 (de)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19628292B4 (de) 1996-07-12 2007-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
US6195633B1 (en) * 1998-09-09 2001-02-27 Sony Corporation System and method for efficiently implementing a masking function in a psycho-acoustic modeler
TW477119B (en) * 1999-01-28 2002-02-21 Winbond Electronics Corp Byte allocation method and device for speech synthesis
US7099830B1 (en) * 2000-03-29 2006-08-29 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US6735561B1 (en) * 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US6678648B1 (en) * 2000-06-14 2004-01-13 Intervideo, Inc. Fast loop iteration and bitstream formatting method for MPEG audio encoding
US6882976B1 (en) * 2001-02-28 2005-04-19 Advanced Micro Devices, Inc. Efficient finite length POW10 calculation for MPEG audio encoding
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
US7283968B2 (en) 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
US7426462B2 (en) * 2003-09-29 2008-09-16 Sony Corporation Fast codebook selection method in audio encoding
KR100723400B1 (ko) * 2004-05-12 2007-05-30 삼성전자주식회사 복수의 룩업테이블을 이용한 디지털 신호 부호화 방법 및장치
KR100695125B1 (ko) 2004-05-28 2007-03-14 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
US7725313B2 (en) * 2004-09-13 2010-05-25 Ittiam Systems (P) Ltd. Method, system and apparatus for allocating bits in perceptual audio coders
DE102004059979B4 (de) 2004-12-13 2007-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Berechnung einer Signalenergie eines Informationssignals
CN101192410B (zh) * 2006-12-01 2010-05-19 华为技术有限公司 一种在编解码中调整量化质量的方法和装置
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
US8924207B2 (en) * 2009-07-23 2014-12-30 Texas Instruments Incorporated Method and apparatus for transcoding audio data
SG194945A1 (en) 2011-05-13 2013-12-30 Samsung Electronics Co Ltd Bit allocating, audio encoding and decoding

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
US4926482A (en) * 1987-06-26 1990-05-15 Unisys Corp. Apparatus and method for real time data compressor
EP0525774A2 (de) * 1991-07-31 1993-02-03 Matsushita Electric Industrial Co., Ltd. Verfahren und Einrichtung zur Kodierung eines digitalen Audiosignals
DE3784120T2 (de) * 1986-08-25 1993-08-12 Ibm Tabellengesteuerte dynamische bitverteilung in einem teilband-sprachkodierer mit veraenderlicher datenrate.

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5042069A (en) * 1989-04-18 1991-08-20 Pacific Communications Sciences, Inc. Methods and apparatus for reconstructing non-quantized adaptively transformed voice signals
JP2841765B2 (ja) * 1990-07-13 1998-12-24 日本電気株式会社 適応ビット割当て方法及び装置
ES2087522T3 (es) * 1991-01-08 1996-07-16 Dolby Lab Licensing Corp Descodificacion/codificacion para campos sonoros multidimensionales.
KR100269213B1 (ko) * 1993-10-30 2000-10-16 윤종용 오디오신호의부호화방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
DE3784120T2 (de) * 1986-08-25 1993-08-12 Ibm Tabellengesteuerte dynamische bitverteilung in einem teilband-sprachkodierer mit veraenderlicher datenrate.
US4926482A (en) * 1987-06-26 1990-05-15 Unisys Corp. Apparatus and method for real time data compressor
EP0525774A2 (de) * 1991-07-31 1993-02-03 Matsushita Electric Industrial Co., Ltd. Verfahren und Einrichtung zur Kodierung eines digitalen Audiosignals

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP 07-0 50 589, Patent Abstracts of Japan, AIPN *

Also Published As

Publication number Publication date
US5864802A (en) 1999-01-26
DE19638997A1 (de) 1997-03-27
JPH09134200A (ja) 1997-05-20
JP3927627B2 (ja) 2007-06-13

Similar Documents

Publication Publication Date Title
DE19638997B4 (de) Digitales Toncodierungsverfahren und digitale Toncodierungsvorrichtung
DE69924431T2 (de) Vorrichtung und Verfahren zur dynamischen Bitverteilung für Audiokodierung
DE69432538T2 (de) Digitales Signalkodierungsgerät, dazugehöriges Dekodiergerät und Aufzeichnungsträger
DE69737302T2 (de) Verfahren zum Codieren von digitalen Audiosignalen
DE69333394T2 (de) Hochwirksames Kodierverfahren und -gerät
DE60015030T2 (de) Auf Block Umschaltung basierender Teilband-Audiokodierer
DE2818052C2 (de) Quantisierung eines Signals mit einem sich über ein gegebenes Frequenzband erstreckendem Spetkrum
DE60310716T2 (de) System für die audiokodierung mit füllung von spektralen lücken
EP0277613B1 (de) Verfahren zur Übertragung eines Audiosignals
DE4313175C2 (de) Verfahren und Vorrichtung zum Aufzeichnen von Audiosignalen in einen Speicher mit direktem Zugriff
DE69533500T2 (de) Verfahren und vorrichtung zum kodieren und dekodieren von nachrichten
DE69233094T2 (de) Verfahren und Anordnung zur Datenkompression bei welchem Quantisierungsbits einem Block in einem gegenwärtigen Rahmen in Abhängigkeit eines Blocks in einem vergangenen Rahmen zugeteilt werden
DE69833834T2 (de) Skalierbares Audiokodier-und Dekodierverfahren und Gerät
DE69924922T2 (de) Audiokodierungsmethode und Audiokodierungsvorrichtung
EP0290581B1 (de) Verfahren zum übertragen digitalisierter tonsignale
DE69006011T3 (de) Transformationscodierer, -decodierer und -codierer/decodierer mit niedriger bitrate für audio-anwendungen hoher qualität.
DE69533577T2 (de) Kodierungs- und/oder Dekodierungsverfahren eines digitalen Audiosignals
DE69434225T2 (de) Verfahren und Vorrichtung zur Aufzeichnung, Wiedergabe, Übertragung und/oder zum Empfang von komprimierten Daten und geeigneter Aufzeichnungsträger
DE4331376C1 (de) Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE602005001291T2 (de) Verfahren zum Kodieren digitaler Signale und Vorrichtung dazu unter Benutzung mehrerer Nachschlagetabellen
DE69826529T2 (de) Schnelle datenrahmen-optimierung in einem audio-kodierer
EP1787284A1 (de) Vorrichtung und verfahren zur robusten klassifizierung von audiosignalen sowie verfahren zu einrichtung und betrieb einer audiosignal-datenbank sowie computer-programm
WO2003007185A1 (de) Verfahren und vorrichtung zum erzeugen eines fingerabdrucks und verfahren und vorrichtung zum identifizieren eines audiosignals
DE4225434A1 (de) Vorrichtung zur aufzeichnung und wiedergabe von komprimierten digitalen daten auf bzw. von einem aufzeichnungstraeger und dabei anwendbares verfahren zur bitentfernung
EP0611516B1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8364 No opposition during term of opposition
R082 Change of representative

Representative=s name: KOTITSCHKE & HEURUNG PARTNERSCHAFT MBB, DE

Representative=s name: KOTITSCHKE & HEURUNG PARTNERSCHAFT MBB PATENT-, DE

Representative=s name: KOTITSCHKE & HEURUNG PARTNERSCHAFT, DE

R071 Expiry of right