DE69925515T2 - Sprachkodierung unter Verwendung einer sanften Adaptation - Google Patents

Sprachkodierung unter Verwendung einer sanften Adaptation Download PDF

Info

Publication number
DE69925515T2
DE69925515T2 DE69925515T DE69925515T DE69925515T2 DE 69925515 T2 DE69925515 T2 DE 69925515T2 DE 69925515 T DE69925515 T DE 69925515T DE 69925515 T DE69925515 T DE 69925515T DE 69925515 T2 DE69925515 T2 DE 69925515T2
Authority
DE
Germany
Prior art keywords
signal
speech
estimate
coding
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69925515T
Other languages
English (en)
Other versions
DE69925515D1 (de
Inventor
Erik Ekudden
Roar Hagen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=21877362&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE69925515(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of DE69925515D1 publication Critical patent/DE69925515D1/de
Application granted granted Critical
Publication of DE69925515T2 publication Critical patent/DE69925515T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/0008Algebraic codebooks

Description

  • GEBIET DER ERFINDUNG
  • Die Erfindung betrifft allgemein ein Sprachcodieren und insbesondere ein Anpassen der Kodierung eines Sprachsignals an lokale Eigenschaften des Sprachsignals.
  • HINTERGRUND DER ERFINDUNG
  • Die meisten bekannten Sprachcodierer wenden das gleiche Kodierungsverfahren an, unbeachtet des lokalen Charakters des zu kodierenden Sprachsegments. Es ist jedoch bekannt, dass eine verbesserte Qualität erzielt werden kann, wenn das Kodierungsverfahren in Übereinstimmung mit dem lokalen Charakter der Sprache geändert wird oder adaptiert wird. Solche adaptiven Verfahren gründen allgemein auf irgendeiner Form von Klassifikation eines gegebenen Sprachsegments, wobei die Klassifikation dazu verwendet wird, einen von mehreren Kodierungsmodi (Mehrfach-Modus-Kodierung) auszuwählen. Solche Techniken sind insbesondere nützlich, wenn Hintergrundrauschen vorliegt, das zur Erlangung deren natürlich klingender Reproduktion davon Kodierungsverfahren erfordert, die sich von der allgemein an das Sprachsignal selbst angelegten Kodierungstechnik unterscheiden. Ein Beispiel einer bekannten Mehrfach-Modus-Kodierungstechnik wird in EP-A-0573398 offenbart.
  • Ein Nachteil im Zusammenhang mit den vorhergehenden genannten Klassifikationsschemata ist es, dass sie gewissermaßen starr sind; was die Gefahr mit sich bringt, dass ein gegebenes Sprachsignal missklassifiziert wird und als ein Ergebnis davon ein ungeeigneter Kodierungsmodus für dieses Segment ausgewählt wird. Der ungeeignete Kodierungsmodus hat typischerweise eine starke Degradation des resultierenden kodierten Sprachsignals zur Folge. Der Klassifikationsansatz beschränkt somit nachteilig die Leistung des Sprachkodierers.
  • Eine wohlbekannte Technik zum Mehrfach-Modus-Kodieren ist es, eine Regelkreis-Modusentscheidung zu treffen, wobei der Kodierer alle Modi ausprobiert und sich in Übereinstimmung mit einem Kriterium für den besten entscheidet. Dieses mildert das Fehlklassifikationsproblem in gewissem Ausmaß, es ist jedoch ein Problem, ein gutes Kriterium für solch ein Verfahren zu finden. Es ist, wie es auch der Fall ist für die vorhergehenden Klassifizierungsschemata, notwendig, Information zu übermitteln (d.h. Overhead-Bits vom Transmitter-Kodierer durch den Kommunikationskanal zum Empfänger-Dekodierer zu senden), die beschreiben , welcher Modus gewählt ist. Das beschränkt die Anzahl von Kodierungsmodi in der Praxis.
  • Es ist daher gewünscht zu ermöglichen, dass eine Sprachkodierungs- (Encoding- oder Dekodierungs-) Prozedur, basierend auf dem lokalen Charakter der Sprache geändert oder adaptiert werden kann, ohne die schwerwiegenden mit den vorhergehend genannten bekannten Klassifikationsansätzen in Zusammenhang stehenden Verschlechterungen, und ohne eine Übertragung von Overhead-Bits zu erfordern, um die ausgewählte Adaption zu beschreiben.
  • In Übereinstimmung mit der vorliegenden Erfindung, wie in den angefügten Ansprüchen beansprucht, kann eine Sprachkodierungs (Encoding- oder Dekodierung) Prozedur ohne starre Klassifikationen und ohne das begleitende Risiko einer schwerwiegenden Verschlechterung des kodierten Sprachsignals, und ohne eine Übertragung von Overhead-Bits zu erfordern, angepasst werden, um die ausgewählte Adaption zu beschreiben. Die Adaption basiert auf in dem Kodierer (Encoder oder Dekodierer) bereits existierenden Parametern und es muss daher keine zusätzliche Information zur Beschreibung der Adaption übertragen werden. Dieses macht ein vollkommen weichanpassungsfähiges Schema möglich, bei dem eine unbegrenzte Anzahl von Modifikationen des Kodierungs (Encoding oder Dekodierung) – Verfahrens möglich ist. Darüber hinaus basiert die Adaption auf der Charakterisierung des Signals durch den Kodierer und die Anpassung wird in Übereinstimmung damit vorgenommen, wie gut der grundlegende Kodierungsansatz für ein bestimmtes Sprachsegment arbeitet.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • 1 zeigt ein Blockdiagramm, das allgemein ein weichadaptives Sprachkodierungsschema in Übereinstimmung mit der vorliegenden Erfindung veranschaulicht.
  • 1A veranschaulicht detaillierter die Anordnung von 1.
  • 2 veranschaulicht detaillierter die Anordnung von 1A.
  • 3 veranschaulicht detaillierter den Mehrfachebenen-Code-Modifizierer von 2 und 21.
  • 4 veranschaulicht ein Beispiel des weichadaptiven Controllers von 2 und 21.
  • 5 ist ein Flussdiagramm, das den Betrieb des weichadaptiven Controllers von 4 veranschaulicht.
  • 6 veranschaulicht diagrammartig ein Anti-Spärlichkeitsfilter in Übereinstimmung mit der Erfindung, der als eine der Modifiziererebenen in dem Mehrfachebenen-Code-Modifizierer von 3 verwendet werden kann.
  • 7 bis 11 veranschaulichen grafisch den Betrieb eines Anti-Spärlichkeitsfilters des in 6 veranschaulichten Typs.
  • 12 bis 16 veranschaulichen grafisch den Betrieb des Anti-Spärlichkeitsfilters des in 6 veranschaulichten Typs und auf einer relativ niedrigeren Ebene eines Anti-Spärlichkeitsbetriebs, als der Anti-Spärlichkeitsfilter von 7 bis 11.
  • 17 veranschaulicht einen entsprechenden Abschnitt einer weiteren Sprachkodierungsanordnung gemäß der Erfindung.
  • 18 veranschaulicht einen entsprechenden Abschnitt einer weiteren Sprachkodierungsanordnung gemäß der Erfindung.
  • 19 veranschaulicht eine auf die Sprachkodierungsanordnungen von 2, 17 und 21 anwendbare Modifikation.
  • 20 ist ein Blockdiagramm, das allgemein ein weichadaptives Sprachkodierungsschema gemäß der Erfindung veranschaulicht.
  • 20A veranschaulicht detaillierter die Anordnung von 20
  • 21 veranschaulicht detaillierter die Anordnung von 20A.
  • DETAILLIERTE BESCHREIBUNG
  • Die beispielhafte 1 veranschaulicht allgemein die Anwendung der vorliegenden Erfindung auf einen Sprachkodierungsvorgang. Die Anordnung von 1 könnte beispielsweise in einer drahtlosen Sprachkommunikationsvorrichtung verwendet werden, wie beispielsweise einem Zellulartelefon. Eine Sprachkodierungsanordnung 11 empfängt an einem Eingang ein unkodiertes Signal und liefert an einem Ausgang ein kodiertes Sprachsignal. Das unkodierte Signal ist ein ursprüngliches Sprachsignal. Die Sprachkodierungsanordnung 11 inkludiert einen Steuereingang 17 zum Empfang von Steuersignalen von einem weichadaptiven Controller 19. Die Steuersignale von dem Controller 19 geben an, inwieweit der Kodierungsbetrieb, der durch die Kodierungsanordnung 11 durchgeführt wird, anzupassen ist. Der Controller 19 inkludiert einen Eingang 18 zum Empfang von Information von dem Kodierer 11, die die lokalen Sprachcharakteristika des unkodierten Signals angibt. Der Controller 19 liefert die Steuersignale bei 17 in Reaktion auf die bei 18 empfangene Information.
  • 1A veranschaulicht ein Beispiel einer Sprachkodierungsanordnung des allgemeinen in 1 gezeigten Typs, inkludierend einen Kodierer und eine weichadaptive Steuerung gemäß der Erfindung. 1A zeigt die relevanten Abschnitte eines Code Excited Linear Prediction (CELP (Codeanregungslinearvorhersage)) Sprachkodierers einschließlich eines Festverstärkungsformabschnitts 12 und eines adaptiven Verstärkungsformabschnitts 14. Eine weichadaptive Steuerung wird für den Festverstärkungsformabschnitt 12 bereitgestellt, um eine Weichadaption des Festverstärkungsformkodierverfahrens zu erlauben, das durch den Abschnitt 12 implementiert wird.
  • 2 veranschaulicht detaillierter die beispielhafte CELP-Kodierungsanordnung von 1A. Wie in 2 gezeigt, umfasst der Festverstärkungsform-Kodierungsabschnitt 12 von 1A ein festgelegtes Codebuch 21, einen Verstärkungsmultiplizierer 25 und einen Codemodifizierer 16. Der adaptive Verstärkungsformkodierungsabschnitt 14 von 1A inkludiert ein adaptives Codebuch 23 und einen Verstärkungsvervielfacher 29. Die an das feste Codebuch 21 angelegte Verstärkung FG und die an das adaptive Codebuch 23 angelegte Verstärkung AG werden bekannterweise in CELP Kodierern erzeugt. Insbesondere wird ein bekanntes Suchverfahren durchgeführt und hängt von der unkodierten Signaleingabe und der Ausgabe des Synthesefilters 28 ab, wie es im Stand der Technik wohlbekannt ist. Das Suchverfahren liefert die Verstärkungen AG und FG, und auch die Eingaben für die Codebücher 21 und 23.
  • Die adaptive Codebuchverstärkung AG und die feste Codebuchverstärkung FG werden in den Controller 19 eingegeben, um Information bezüglich der lokalen Sprachcharakteristika bereitzustellen. Insbesondere erkennt die Erfindung, dass die adaptive Codebuchverstärkung AG auch als ein Indikator des Stimmpegels (d.h. Stärke der Tonlagenperiodizität) des momentanen Sprachsegments verwendet werden kann, und dass die feste Codebuchverstärkung FG auch als ein Indikator der Signalenergie des momentanen Sprachsegments verwendet werden kann. Bei einer konventionellen 8 kHz Abtastrate wird auf einen jeweiligen Block von beispielsweise 40 Abtastwerten jede 5 ms von jedem des konventionellen adaptiven Codebuchs 21 und festen Codebuchs 23 zugegriffen. Für das durch die jeweiligen Blöcke von Abtastwerten, auf die momentan von dem festen Codebuch 21 und dem adaptiven Codebuch 23 zugegriffen wird, dargestellte Sprachsegment, liefert AG die Stimmpegelinformation und FG liefert die Signalenergieinformation.
  • Ein Codemodifizierer 16 empfängt bei 24 eine kodierte Signalschätzung von dem festen Codebuch 21, nach einer Anwendung der Verstärkung FG bei 25. Der Modifizierer 16 liefert dann bei 26 eine selektiv modifizierte kodierte Signalschätzung für eine Summierungsschaltung 27. Der andere Eingang der Summierungsschaltung 27 empfängt die kodierte Signalschätzungsausgabe von dem adaptiven Codebuch 23, nach einer Anwendung der adaptiven Codebuchverstärkung AG bei 29, wie dies konventionell der Fall ist. Die Ausgabe der Summierungsschaltung 27 steuert den konventionellen Synthesefilter 28 an, und wird weiter zu dem adaptiven Codebuch 23 zurückgeführt.
  • Falls die adaptive Codebuchverstärkung AG hoch ist, dann verwendet der Kodierer verstärkt die adaptive Codebuchkomponente, da das Sprachsegment wahrscheinlich ein stimmhaftes Sprachsegment ist, das typischerweise durch den CELP Kodierer akzeptabel verarbeitet wird, mit geringer oder keiner Adaption des Kodierungsprozesses. Falls AG niedrig ist, ist das Signal wahrscheinlich entweder stimmlose Sprache oder Hintergrundrauschen. In dieser Situation mit niedrigem AG sollte der Modifizierer 16 vorteilhafter Weise einen relativ hohen Pegel einer Kodierungsmodifikation bereitstellen. In Bereichen zwischen einer hohen adaptiven Codebuchverstärkung und einer niedrigen adaptiven Codebuchverstärkung ist die erforderliche Modifikationsmenge vorzugsweise irgendwo zwischen der relativ hohen Ebene von Modifikation in Zusammenhang mit einer niedrigen adaptiven Codebuchverstärkung und der relativ niedrigen oder keinen Modifikation in Zusammenhang mit einer hohen adaptiven Codebuchverstärkung.
  • Die beispielhafte 3 veranschaulicht detaillierter den Codemodifizierer 16 von 2. Wie in der beispielhaften 3 gezeigt, betreiben bei 17 von Controller 19 empfangene Steuersignale Schalter 31 und 33, um eine erwünschte Ebene für eine Modifikation der bei 24 empfangenen kodierten Signalschätzung auszuwählen. Wie in 3 gezeigt, leitet die Modifikationsebene 0 die kodierte Signalschätzung ohne Modifikation weiter. In einem Ausführungsbeispiel liefert die Modifikationsebene 1 eine relativ niedrige Ebene für die Modifikation, die Modifikationsebene 2 liefert eine Ebene für eine Modifikation, ddie relativ gesehen höher als die ist, die durch die Modifikationsebene 1 bereitgestellt wird, und beide Modifikationsebenen 1 und 2 liefern weniger Codemodifikation als beispielsweise durch eine Modifikationsebene N bereitgestellt. Somit verwendet der weichadaptive Controller die adaptive Codebuchverstärkung (Stimmpegelin formation) und die feste Codebuchverstärkung (Signalenergieinformation) um auszuwählen, wie viel (welche Ebene einer) Modifikation des Codemodifizierers 16 für die codierte Signalschätzung geeignet ist. Da diese Verstärkungsinformation bereits durch den Kodierer bei dessen Kodierungsprozess erzeugt wird, wird kein Overhead benötigt, um den erwünschten Stimmpegel und die Signalenergieinformation zu erzeugen.
  • Obwohl die adaptive Codebuchverstärkung und die feste Codebuchverstärkung dazu verwendet werden, jeweilige Information bezüglich des Stimmpegels und der Signalenergie bereitzustellen, können andere geeignete Parameter die erwünschte Stimmpegel- und Signalenergieinformation (oder andere erwünschte Information) bereitstellen, wenn die weichadaptiven Steuertechniken der vorliegenden Erfindung in Sprachcodierern inkorporiert werden, die sich von CELP-Decodern unterscheiden.
  • Die beispielhafte 4 zeigt ein Blockdiagramm, das detaillierter das Ausführungsbeispiel des weichadaptiven Controllers 19 von 2 veranschaulicht. Die adaptive Codebuchverstärkung AG und die feste Codebuchverstärkung FG für jedes Sprachsegment werden in jeweiligen Puffern 41 und 42 empfangen und gespeichert. Die Puffer 41 und 42 werden dazu verwendet, die Verstärkungswerte des momentanen Sprachsegments und auch die Verstärkungswerte einer vorgegebenen Anzahl von vorhergehenden Sprachsegmenten zu speichern. Die Puffer 41 und 42 sind mit einer Verfeinerungslogik 43 verbunden. Die Verfeinerungslogik 43 weist einen Ausgang 45 auf, der mit einer Codemodifikationsebenen-Abbildung 44 verbunden ist. Die Codemodifikationsebenen-Abbildung 44 (z.B. eine Nachschlagtabelle) liefert an einem Ausgang 49 eine vorgeschlagene neue Ebene für eine Modifikation, die durch den Codemodifizierer 16 zu implementieren ist. Diese neue Modifikationsebene ist in einem Neuebenen-Register 46 gespeichert. Das Neuebenen-Register 46 ist mit einem Momentanebenen-Register 48 verbunden, und eine Hysterese-Logik 47 ist mit beiden Registern 47 und 48 verbunden. Das Momentanebenenregister 48 liefert die Information bezüglich der erwünschten Modifikationsebene zum Eingang 17 des Codemodifizierers 16. Der Codemodifizierer 16 bedient dann die Schalter 31 und 33, um die Modifikationsebene bereitzustellen, die durch das Momentanebenenregister 48 angezeigt wird.
  • Die Struktur und ein Betrieb des weichadaptiven Controllers von 4 ist weiter mit Bezug auf das Flussdiagramm von 5 zu verstehen.
  • 5 veranschaulicht ein Beispiel des durch das in den 2 und 4 veranschaulichte Ausführungsbeispiel des weichadaptiven Controllers ausgeführten Ebenensteuerungsbetriebs. Bei 50 in 5 wartet der weichadaptive Controller darauf, die adaptive Codebuchverstärkung AG zu empfangen, die dem letzten Block von Abtastwerten zugeordnet ist, erhalten von dem adaptiven Codebuch. Nachdem AG empfangen wurde, bestimmt die Verfeinerungslogik 43 von 4 bei 51, ob dieser neue adaptive Codebuchverstärkungswert größer als ein Schwellwert THAG ist. Wenn nicht, dann wird der adaptive Codebuchverstärkungswert AG bei 56 dazu verwendet, einen NEUEBENEN-Wert von der Abbildung 44 von 4 zu erhalten. Wenn der adaptive Codebuchverstärkungswert den Schwellwert THAG nicht überschreitet, leitet somit die Verfeinerungslogik 43 von 4 den adaptiven Codebuch-Verstärkungswert zur Codemodifikationsebenen-Abbildung 44 von 4, wo der adaptive Codebuchverstärkungswert dazu verwendet wird, den NEUEBENEN-Wert zu erlangen.
  • In einem Ausführungsbeispiel der Erfindung werden adaptive Codebuchverstärkungswerte in einem ersten Bereich in einen NEUEBENEN-Wert von 0 abgebildet (somit wird Ebene 0 im Codemodifizierer von 3 ausgewählt), Verstärkungswerte in einem zweiten Bereich werden auf einen NEUEBENEN-Wert von 1 abgebildet (somit wird die Ebene 1 Modifikation in dem Codemodifizierer von 3 ausgewählt), Verstärkungswerte in einem dritten Bereich werden in einen NEUEBENEN-Wert von 2 abgebildet (entsprechend einer Auswahl der Ebenen 2 Modifikation in einem Codemodifizierer 16) und so weiter. Jeder Verstärkungswert kann in einen eindeutigen NEUEBENEN-Wert abgebildet werden, vorausgesetzt, dass der Modifizierer 11 genug Modifikationsebenen aufweist. Wenn sich das Verhältnis von Modifikationsebenen zu AG Werten erhöht, können Änderungen einer Modifikationsebene feiner sein (sich sogar an infinitesinale Werte annähern), wodurch eine "weiche" Adaption an Änderungen bei AG bereitgestellt wird.
  • Falls der adaptive Codebuchverstärkungswert den Schwellwert bei 51 überschreitet, überprüft die Verfeinerungslogik 43 von 4 den festen Codebuchverstärkungspuffer 42, um festzustellen, ob der über dem Schwellwert liegende AG-Wert einer großen Erhöhung des FG-Werts entspricht, wobei diese Vergrößerung von FG anzeigen würde, dass ein Sprachbeginn auftritt. Falls ein Beginn bei 52 erfasst wird, dann wird der adaptive Codebuchverstärkungswert bei 56 an die Abbildung angelegt (siehe 44 in 4).
  • Falls bei 52 kein Beginn angezeigt ist, dann betrachtet die Verfeinerungslogik (siehe 43 in 4) frühere Werte der adaptiven Codebuchverstärkung, wie sie in Puffer 41 in 4 gespeichert sind. Obwohl der momentane AG-Wert ein über dem Schwellwert liegender Wert von Schritt 51 ist, werden nichts desto weniger vorherige AG-Werte bei 53 betrachtet, um bei 54 festzustellen, ob oder ob nicht der über dem Schwellwert liegende AG-Wert ein unechter Wert ist. Beispiele des Verarbeitungstyps, der bei 53 implementiert werden kann, sind ein Glättungsbetrieb, ein Mittlungsbetrieb oder Typen von Filterbetriebsvorgängen oder einfach ein Zählen der Anzahl von vorherigen AG-Werten, die den Schwellwert THAG nicht überschritten haben. Falls beispielsweise die Hälfte oder mehr der AG-Werte in dem Puffer 41 den Schwellwert THAG nicht überschreiten, dann wird der "Ja"-Pfad (unechter AG-Wert) vom Block 54 gewählt und die Verfeinerungslogik (43 in 4) erniedrigt den AG-Wert bei 55. Wie oben erwähnt neigen die niedrigeren AG-Werte dazu, einen niedrigeren Stimmpegel anzuzeigen, so dass der niedrigere AG-Wert vorzugsweise in einen höheren NEUEBENEN-Wert abgebildet wird, der eine relativ große Modifikation der codierten Sprachschätzung zur Folge haben wird. Es wird darauf hingewiesen, dass ein über dem Schwellwert liegender AG-Wert akzeptiert wird, ohne vorhergehende AG-Werte zu betrachten, falls bei 52 ein Beginn festgestellt wird. Falls kein unechter AG-Wert bei 53 und 54 erfasst wird, dann wird der über dem Schwellwert liegende AG-Wert akzeptiert, und bei 56 an die Abbildung 44 angelegt.
  • Es sollte gewürdigt werden, dass die Verfügbarkeit und Betrachtung von vorhergehender Information, die durch den Codierer verwendet wird, wie etwa AG-Werte, beispielsweise bei 53-55 von 5, eine hoch auflösende "weiche" adaptive Steuerung ermöglicht, bei der eine unbegrenzte Anzahl von Modifikatonen oder Anpassungen des Codierungsverfahrens möglich ist.
  • Bei 57 in 5 vergleicht die Hystereselogik (siehe 47 in 4) den NEUEBENEN-Wert (NL) mit dem MOMENTANEBENEN-Wert (CL), um die Differenz (DIFF) zwischen diesen Werten zu erhalten. Falls bei 58 die Differenz DIFF einen Hystereseschwellwert THH überschreitet, dann inkrementiert oder dekrementiert die Hystereselogik bei 59 den NEUEBENEN-Wert, wie es erforderlich ist, um ihn näher an den MOMENTANEBENEN-Wert anzunähern. Dann werden die NEUEBENEN- und MOMENTANEBENEN-Werte wiederum bei 57 verglichen, um die Differenz DIFF zwischen ihnen zu bestimmen. Es wird dann danach bei 58 festgestellt, ob DIFF den Hystereseschwellwert überschreitet, und falls ja, wird der NEUEBENEN-Wert wiederum näher an den MOMENTANEBENEN-Wert bei 59 angenähert, und die Differenz DIFF wird erneut bei 57 bestimmt. Wann immer festgestellt wird, dass die Differenz DIFF den Hystereseschwellwert bei 58 nicht überschreitet, erlaubt bei 60 die Hystereselogik (47 in 4) dass der NEUEBENEN-Wert in das MOMENTANEBENEN-Register 48 geschrieben wird. Der MOMENTANEBENEN-Wert vom Register 48 ist mit dem Schaltersteuereingang 17 des Codemodifizierers von 3 verbunden, um dadurch die erwünschte Modifikationsebene auszuwählen.
  • Es ergibt sich aus dem Vorhergehenden, dass die Hystereselogik 47 die Anzahl von Ebenen begrenzt, um die sich die Modifikation von einem Sprachsegment zum nächsten ändern kann. Es wird jedoch darauf hingewiesen, dass der Hysteresebetrieb von 57 bis 59 vom Entscheidungsblock 61 umgangen wird, falls die Verfeinerungslogik aus dem festen Codebuchverstärkungspuffers feststellt, dass ein Sprachbeginn auftritt. In diesem Fall setzt die Verfeinerungslogik 43 den Hysteresebetrieb der Hystereselogik 47 (siehe Steuerleitung 40 in 4) aus. Dieses erlaubt, dass der NEUEBENEN-Wert direkt in das MOMENTANEBENEN-Register 48 geladen wird. Somit wird beim Auftreten eines Sprachbeginns keine Hysterese angelegt.
  • Die oben beschriebene Verwendung von AG und FG zur Steuerung der Adaptionsentscheidungen erfordert vorteilhafterweise keinen Bitübertragungsoverhead, da AG und FG durch den Kodierer selbst basierend auf dessen eigener Charakterisierung des uncodierten Eingangssignals erzeugt werden.
  • Die Beispielfigur 20 veranschaulicht allgemein die Anwendung der vorliegenden Erfindung auf einen Sprachdekodierungsprozess. Die Anordnung von 20 könnte beispielsweise in einer drahtlosen Sprachkommunikationsvorrichtung verwendet werden, wie beispielsweise einem Zellulartelefon. Eine Sprachdekodierungsanordnung empfängt bei 200 kodierte Information an einem Eingang und liefert ein dekodiertes Signal an einem Ausgang. Die kodierte Information, die an dem Eingang des Dekoders 200 empfangen wird, stellt beispielsweise die empfangene Version der kodierten Signals dar, ausgeben durch den Kodierer 11 in 1 und übermittelt durch einen Kommunikationskanal zum Dekoder 200. Die weichadaptive Steuerung 19 der vorliegenden Erfindung wird an den Dekoder 200 analog zu dem angewendet, was oben mit Bezug auf den Kodierer 11 von 1 beschrieben wurde.
  • 20A veranschaulicht ein Beispiel einer Sprachdekodierungsanordnung des allgemeinen in 20 gezeigten Typs, einschließlich eines Decoders und einer weichadaptiven Steuerung gemäß der Erfindung. 20A zeigt relevante Abschnitte eines CELP-Sprachdekoders. Die CELP-Dekodierungsanordnung von 20A ist ähnlich zu der CELP-Kodierungsanordnung, die in 1A gezeigt ist, mit Ausnahme, dass die Eingaben für die festen und adaptiven Verstärkungsformkodierungsabschnitte 12 und 14 erhalten werden, indem die an dem Dekodereingang empfangene kodierte Information ent-multiplexiert wird (bekannter Vorgang), wohingegen die Eingaben zu diesen Abschnitten des Kodierers von 1A aus dem bekannten Suchverfahren erlangt werden. Diese Beziehungen unter CELP Encodern und CELP Dekodern sind im Stand der Technik wohlbekannt. In 20A, wie auch in 1A, wird die weichadaptive Steuerung 19 der vorliegenden Erfindung an den Festverstärkungsformkodierabschnitt 12 angelegt und auf eine Art und Weise, die allgemein analog zu der mit Bezug auf 1A beschriebenen ist.
  • Wie es deutlicher in der Beispielfigur 21 zu sehen ist, die die Anordnung von 20A detaillierter zeigt, ist die Anwendung der weichadaptiven Steuerung 19 der vorliegenden Erfindung in der Dekoderanordnung von 21 analog zu ihrer Implementierung in dem Encodermanagment von 2. Wie oben erwähnt, werden die Eingaben an das feste und adaptive Codebuch 21 und 23 aus der empfangenen kodierten Information ent-multiplexiert. Ein Verstärkungsdekoder 22 empfängt auch Eingangssignale, die aus der an dem Dekoder empfangenen kodierten Information ent-multiplexiert wurden, wie dies herkömmlich der Fall ist. Es sollte aus einem Vergleich der 2 und 21 klar sein, dass die weichadaptive Steuerung der vorliegenden Erfindung in dem Dekoder von 21 auf eine Art und Weise arbeitet, die analog zu der mit Bezug auf den Encoder von 2 beschriebenen ist. Es versteht sich daher, dass die vorhergehende Beschreibung der Anwendung der weichadaptiven Steuerung der vorliegenden Erfindung mit Bezug auf den Encoder von 2 (einschließlich 3-5 und entsprechender Text) analog anwendbar auf den Dekoder von 21 ist.
  • 6 veranschaulicht eine Beispielimplementierung einer der Modifikationsebenen des Codemodifizierers von 3. Die Anordnung von 6 kann als ein Anti-Spärlichkeitsfilter charakterisiert werden, der dazu ausgelegt ist, eine Spärlichkeit der kodierten Sprachschätzung zu reduzieren, die von dem festen Codebuch von 2 oder 21 empfangen wurde. Spärlichkeit bezeichnet allgemein die Situation, in der nur einige wenige der Abtastwerte eines gegebenen Codebucheintags im festen Codebuch 21, beispielsweise einem algebraischen Codebuch, einen Nicht-Null-Abtastwert aufweisen. Diese Spärlichkeitsbedingung ist insbesondere vorherrschend, wenn die Bitrate des algebraischen Codebuchs reduziert ist, in einem Versuch, eine Sprachkompression bereitzustellen. Mit sehr wenigen Nicht-Null-Abtastwerten in den Codebucheinträgen ist die sich ergebende Spärlichkeit eine leicht festzustellende Degradierung der codierten Sprachsignale von konventionellen Sprachcodierern.
  • Der Antispärlichkeitsfilter, der in 6 veranschaulicht ist, ist dazu ausgelegt, das Spärlichkeitsproblem abzumildern. Der Anti-Spärlichkeitsfilter von 6 enthält einen Konvoluter 63, der eine zirkulare Faltung der von dem festen (z.B. algebraischen) Codebuch 21 empfangenen codierten Sprachschätzung mit einer Impulsantwort (bei 65) in Zusammenhang mit einem Allpassfilter durchführt. Der Betriebsvorgang eines Beispiels des Anti-Spärlichkeitsfilters von 6 ist in den 7-11 veranschaulicht.
  • 10 veranschaulicht ein Beispiel eines Eintrags von dem Codebuch 21 von 2 (oder 21) mit nur zwei Nicht- Null-Abtastwerten aus einer Gesamtheit von 40 Abtastwerten. Diese Spärlichkeitscharakteristik wird reduziert werden, falls die Anzahl von Nicht-Null-Abtastwerten erhöht werden kann. Eine Möglichkeit zur Erhöhung der Anzahl von Nicht-Null-Abtastwerten ist es, den Codebucheintrag von 10 an einen Filter mit einer geeigneten Charakteristik anzulegen, um die Energie über den Block von 40 Abtastwerten zu verteilen. 7 und 8 veranschaulichen jeweils die Größen- und Phasen-(in RAD) Eigenschaften eines Allpassfilters, der betriebsfähig ist, die Energie über die 40 Abtastwerte des Codebucheintrags von 10 geeignet zu verteilen. Die Filter von 7 und 8 verändern das Phasenspektrum im Hochfrequenzbereich zwischen 2 und 4 kHz, während die Niedrigfrequenzbereiche unterhalb 2 kHz nur sehr marginal verändert werden.
  • Die beispielhafte 9 veranschaulicht grafisch die Impulsantwort des Allpassfilters, der durch die 7 und 8 definiert ist. Der Anti-Spärlichkeitsfilter von 6 erzeugt eine zirkulare Faltung der Impulsantwort von 9 auf den Block von Abtastwerten von 10. Da die Codebucheinträge von dem Codebuch als Blöcke von 40 Abtastwerten bereitgestellt werden, wird der Faltungsbetrieb auf Blockart durchgeführt. Jeder Abtastwert in 10 wird 40 Zwischenmultiplikationsergebnisse im Faltungsbetrieb erzeugen. Wenn der Abtastwert bei Position 7 in 10 als ein Beispiel genommen wird, werden die ersten 34 Multiplikationsergebnisse Positionen 7-40 von dem sich ergebenden Block in 11 zugeordnet und die verbleibenden sechs Multiplikationsergebnisse werden durch den Zirkularfaltungsbetrieb "umgeschlagen", so dass sie Positionen 1-6 des Ergebnisblocks zugeordnet werden. Die 40 Zwischenmultiplikationsergebnisse, die durch jeden der verbleibenden Abtastwerte von 10 erzeugt werden, werden Positionen im Ergebnisblock von 11 auf analoge Weise zugeordnet, und Abtastwert 1 benötigt natürlich keine Umschlagung (Wrap Around). Für jede Position im Ergebnisblock von 11 werden die 40 dem zugeordneten Zwischenmultiplikationsergebnisse (ein Multiplikationsergebnis pro Abtastwert in 10) aufsummiert, und diese Summe repräsentiert das Faltungsergebnis für diese Position.
  • Bei einer Betrachtung von 10 und 11 wird es klar, dass der zirkulare Faltungsbetrieb das Fourier-Spektrum des Blocks von 10 ändert, so dass die Energie über den Block verteilt wird, wodurch die Anzahl von Nicht-Null-Abtastwerten dramatisch erhöht wird, und entsprechend das Spärlichkeitsausmaß reduziert wird. Die Effekte einer Durchführung einer zirkularen Faltung auf einer Block-Um-Block-Basis können durch den Synthesefilter 28 in 2 (oder 21) ausgeglättet werden.
  • 12 bis 16 veranschaulichen ein weiteres Beispiel des Betriebs eines Anti-Spärlichkeits-Filters des allgemein in 6 gezeigten Typs. Der Allpassfilter von 12 und 13 verändert das Phasenspektrum zwischen 3 und 4 kHz ohne substantiell das Phasenspektrum unter 3 kHz zu ändern. Die Impulsantwort des Filters ist in 14 gezeigt. Unter Bezugnahme auf 16, und unter dem Hinweis, dass die 15 den gleichen Block von Abtastwerten wie 10 veranschaulicht, wird es klar, dass der in 12 bis 16 veranschaulichte Anti-Spärlichkeitsbetrieb die Energie nicht in einem solchen Ausmaß verteilt, wie es in 11 gezeigt ist. Somit definieren 12 bis 16 einen Anti-Spärlichkeitsfilter, der den Codebucheintrag weniger als der durch die 7 bis 11 definierte Filter modifiziert. Demzufolge definieren die Filter von 7 bis 11 und 12 bis 16 jeweils andere Modifikatonsebenen der kodierten Sprachschätzung. Unter erneuter Bezugnahme auf die 2 und 3 zeigt ein niedriger AG-Wert an, dass die adaptive Codebuchkomponente relativ klein sein wird, was einen relativ großen Beitrag von dem festen (z.B. algebraischen) Codebuch 21 ermöglicht. Aufgrund der vorhergehend genannten Spärlichkeit der festen Codebucheinträge würde der Controller 19 eher den Anti-Spärlichkeitsfilter von 7 bis 11 als den von 12 bis 16 auswählen, da der Filter von den 7 bis 11 eine größere Modifikation des Abtastblocks bereitstellt, als es der Filter von 12 bis 16 tut. Mit größeren Werten einer adaptiven Codebuchverstärkung AB wird der Beitrag des festen Codebuchs relativ geringer und der Controller 19 könnte dann beispielsweise den Filter von 12 bis 16 auswählen, der weniger Anti-Spärlichkeitsmodifikation bereitstellt.
  • Die vorliegende Erfindung liefert somit die Fähigkeit zur Verwendung der lokalen Charakteristika eines gegebenen Sprachsegments um festzustellen, ob und inwieweit die codierte Sprachschätzung dieses Segments zu modifizieren ist. Beispiele von verschiedenen Ebenen einer Modifikation umfassen keine Modifikation, einen Anti-Spärlichkeitsfilter mit relativ hohen Energieverteilungscharakteristika und einen Anti-Spärlichkeitsfilter mit relativ geringeren Energieverteilungscharakteristika. Wenn der adaptive Codebuchverstärkungswert hoch ist, zeigt dies in CELP-Kodierern allgemein einen relativ hohen Stimmpegel an, so dass eine geringe oder keine Modifikation typischerweise notwendig ist. Im Gegensatz dazu legt eine niedrige adaptive Codebuchverstärkung typischerweise nahe, dass eine wesentliche Modifikation vorteilhaft sein kann. Im speziellen Beispiel eines Anti-Spärlichkeitsfilters zeigt ein hoher adaptiver Codebuchverstärkungswert gekoppelt mit einer niedrigen festen Codebuchverstärkung an, dass der Beitrag des festen Codebuchs (der spärlichen Verteilung) relativ gering ist, womit eine geringere Modifikation von dem Anti-Spärlichkeitsfilter erforderlich ist (z.B. 12 bis 16). Im Gegensatz dazu zeigt ein höherer fester Codebuchverstärkungswert, gekoppelt mit einem niedrigeren adaptiven Codebuchverstärkungswert an, dass der feste Codebuchbeitrag relativ groß ist, was die Verwendung einer größeren Anti-Spärlichkeitsmodifikation nahe legt (z.B. des Anti-Spärlichkeitsfilters von 7 bis 11). Wie oben erläutert kann ein Mehrfachebenen-Codemodifizierer gemäß der Erfindung so viele unterschiedliche auswählbare Ebenen für eine Modifikation inkorporieren, wie dies erwünscht ist.
  • 17 veranschaulicht eine beispielhafte Alternative zur CELP-Kodierungsanordnung von 2 und der CELP Dekodierungsanordnung von 21, insbesondere unter Anwendung der Mehrfachebenenmodifikation mit weichadaptiver Steuerung der adaptiven Codebuchausgabe.
  • 18 veranschaulicht eine weitere beispielhafte Alternative zur CELP-Kodierungsanordnung von 2 und zur CELP Dekodierungsanordnung von 21, einschließlich des Mehrfachebenen-Codemodifizierers und eines weichadaptiven Controllers, angewendet auf die Ausgabe des Summierungsgatters.
  • Die beispielhafte 19 zeigt, wie die CELP-Kodierungsanordnung von 2, 17 und 21 modifiziert werden kann, um eine Rückkopplung zum adaptiven Codebuch 23 von einer Summierungsschaltung 10 bereitzustellen, deren Eingänge stromaufwärts vom Modifizierer 16 liegen.
  • Es versteht sich für den Fachmann, dass die oben mit Bezug auf die 1 bis 21 beschriebenen Ausführungsbeispiele unter Verwendung eines geeignet programmierten digitalen Signalprozessors oder anderen Datenprozessors leicht implementiert werden können, und alternativ implementiert werden können, unter Verwendung eines solchen geeignet programmierten digitalen Signalprozessors oder anderen Datenprozessors in Kombination mit einer zusätzlichen damit verbundenen externen Schaltungsanordnung.
  • Obwohl beispielhafte Anordnungen der vorliegenden Erfindung detailliert oben beschrieben sind, beschränkt dies nicht den Bereich der Erfindung, die in einer Vielzahl von Ausführungen praktiziert werden kann, solange wie diese Ausführungsformen in den Bereich der angefügten Ansprüche fallen.
  • Gemäß einer anderen Ausführungsform kann eine Sprachkodierungsvorrichtung die folgenden Elemente aufweisen:
    • 1) Eine Sprachcodiervorrichtung zum Erzeugen einer codierten Darstellung eines ursprünglichen Sprachsignals, umfassend: einen Eingang zum Empfangen des ursprünglichen Sprachsignals; einen Ausgang zum Bereitstellen der codierten Darstellung des ursprünglichen Sprachsignals; einen Codierer, gekoppelt zwischen dem Eingang und dem Ausgang, zum selektiven Durchführen in dem ursprünglichen Sprachsignal entweder einer Codierungsoperation oder einer Adaptierung der Codierungsoperation, um die codierte Darstellung zu erzeugen; und einen Controller der mit dem Codierer gekoppelt ist, um momentan durch den Codierer bei der Codierungsoperation verwendete Information von dort zu empfangen und zu speichern, wobei der Controller einen mit dem Codierer gekoppelten Ausgang umfasst und auf die momentan durch den Codierer bei der Codierungsoperation verwendete Information anspricht, und auf vorhergehende Information, die durch den Codierer bei der Codierungsoperation vorhergehend verwendet wurde, und durch den Controller gespeichert wurde, um dem Codierer zu signalisieren, die Adaption der Codierungsoperation durchzuführen.
    • 2) Die Vorrichtung nach 1), wobei die momentan bei der Codierungsoperation verwendete Information eine Stimminformation umfasst, die einen Stimmpegel des ursprünglichen Sprachsignals anzeigt.
    • 3) Die Vorrichtung nach 2), wobei die Codierungsoperation und die Adaption davon ein adaptives Verstärkungsformcodieren umfasst, und wobei die Stimminformation ein Verstärkungssignal inkludiert, das der adaptiven Verstärkungsformkodierung zugeordnet ist.
    • 4) Die Vorrichtung nach 2), wobei der Controller einen Speicher umfasst zum Halten einer Aufzeichnung von vorhergehenden Stimmpegeln, wie sie durch die Stimminformation angezeigt werden, und eine Verfeinerungslogik, die betreibbar ist, wenn die Stimminformation anzeigt, dass ein momentaner Stimmpegel einen vorgegebenen Schwellwert überschreitet, um den momentanen Stimmpegel mit Bezug auf die vorhergehenden Stimmpegel zu bewerten, um zu bestimmen, ob die Stimminformation, die den momentanen Stimmpegel anzeigt, durch den Controller verwendet werden sollte.
    • 5) Die Vorrichtung nach 1), wobei die momentan bei der Codierungsoperation verwendete Information Signalenergieinformation umfasst, die eine Signalenergie des ursprünglichen Sprachsignals angibt.
    • 6) Die Vorrichtung nach 5), wobei der Codierungsbetrieb und die Adaptierung davon ein festes Verstärkungsformcodieren umfasst, und wobei die Signalenergieinformation ein Verstärkungssignal umfasst, das der festen Verstärkungsformcodierung zugeordnet ist.
    • 7) Die Vorrichtung nach 5), wobei die momentan bei der Codierungsoperation verwendete Information Stimminformation umfasst, die einen Stimmpegel des ursprünglichen Sprachsignals anzeigt.
    • 8) Die Vorrichtung nach 7), wobei der Controller einen Speicher umfasst zum Halten einer Aufzeichnung einer vorhergehenden Signalenergie, wie sie durch die Signalenergieinformation angezeigt wird, und eine Verfeinerungslogik, die betreibbar ist, wenn die Stimminformation anzeigt, dass ein momentaner Stimmpegel einen vor bestimmten Schwellwert überschreitet, um eine momentane Signalenergie mit Bezug auf die vorhergehende Signalenergie zu bewerten um festzustellen, ob die den momentanen Stimmpegel anzeigende Stimminformation durch den Controller verwendet werden sollte.
    • 9) Die Vorrichtung nach 1), wobei der Codierungsbetrieb und dessen Adaptierung ein Linearvorhersagecodieren (linear predictive coding) umfassen.
    • 10) Die Vorrichtung nach 1), wobei der Codierer betreibbar ist, eine von einer Vielzahl von unterschiedlichen Adaptierungen der Codierungsoperation durchzuführen, in Reaktion auf die Controllerausgabe, und wobei der Controller eine Abbildungslogik mit einem Eingang umfasst, um die momentan in der Codierungsoperation verwendete Information zu empfangen, und einen Ausgang aufweist, der anzeigt, welche der Adaptierungen dem Codierer signalisiert werden sollte.
    • 11) Die Vorrichtung nach 10), wobei der Controller eine weitere Logik enthält, die mit dem Abbildungslogikausgang verbunden ist um zu bestimmen, ob die durch den Abbildungslogikausgang angezeigte Adaptierung sich um mehr als einen Schwellwert von der Codierungsoperation unterscheidet.
    • 12) Die Vorrichtung nach 1), wobei der Codierer ein algebraisches Codebuch inkludiert und das Durchführen der Adaptierung Durchführen eines Anti-Sparseness (Anti-Spärlichkeits-) Filterns eines von dem algebraischen Codebuch empfangenen Signals inkludiert.
  • Gemäß einer anderen Ausführungsform kann ein Sprachkodierungsverfahren die folgenden Operationen inkludieren:
    • 13) Ein Sprachcodierungsverfahren zum Erzeugen einer codierten Darstellung eines ursprünglichen Sprachsignals, die Schritte umfassend: Empfangen des ursprünglichen Sprachsignals; Durchführen einer momentanen Codierungsoperation in dem ursprünglichen Sprachsignal, um die codierte Darstellung zu erzeugen; in Reaktion auf momentan in der Codierungsoperation verwendete Information, und vorhergehend in der momentanen Codierungsoperation verwendete Information, Adaptieren der momentanen Codierungsoperation, um eine adaptierte Codierungsoperation zu erzeugen; und Durchführen der adaptierten Codierungsoperation in dem ursprünglichen Sprachsignal.
    • 14) Das Verfahren nach 13), wobei die in der momentanen Codierungsoperation momentan verwendete Information eine Stimminformation inkludiert, die einen Stimmpegel des ursprünglichen Sprachsignals anzeigt.
    • 15) Das Verfahren nach 14), wobei die Durchführungsschritte ein Durchführen einer adaptiven Verstärkungsformcodierung inkludieren, und wobei die Stimminformation ein Verstärkungssignal inkludiert, das der adaptiven Verstärkungsformcodierung zugeordnet ist.
    • 16) Das Verfahren nach 14), einschließlich Halten einer Aufzeichnung von vorhergehenden Stimmpegeln, wie sie durch die Stimminformation angezeigt sind, und, falls die Stimminformation anzeigt, dass ein momentaner Stimmpegel einen vorbestimmten Schwellwert überschreitet, Bewerten des momentanen Stimmpegels mit Bezug auf die vorhergehenden Stimmpegel.
    • 17) Das Verfahren nach 16), einschließlich Modifizieren der Stimminformation, die den momentanen Stimmpegel anzeigt, um einen anderen Stimmpegel anzuzeigen.
    • 18) Das Verfahren nach 17), wobei der andere Stimmpegel ein niedrigerer Stimmpegel ist.
    • 19) Das Verfahren nach 13), wobei die momentan in der momentanen Codierungsoperation verwendete Information eine Signalenergieinformation inkludiert, die eine Signalenergie in dem ursprünglichen Sprachsignal anzeigt.
    • 20) Das Verfahren nach 19), wobei die Durchführungsschritte ein Durchführen einer festen Verstärkungsformcodierung inkludieren, und wobei die Signalenergieinformation ein Verstärkungssignal inkludiert, das der festen Verstärkungsformcodierung zugeordnet ist.
    • 21) Das Verfahren nach 19), wobei die momentan in der momentanen Codierungsoperation verwendete Information eine Stimminformation inkludiert, die einen Stimmpegel des ursprünglichen Sprachsignals anzeigt.
    • 22) Das Verfahren nach 21), einschließlich Halten einer Aufzeichnung einer vorhergehenden Signalenergie, wie sie durch die Signalenergieinformation angezeigt wird, und, falls die Stimminformation anzeigt, dass ein momentaner Stimmpegel einen vorbestimmten Schwellwert überschreitet, Bewerten einer momentanen Signalenergie mit Bezug auf die vorhergehende Signalenergie, um festzustellen, ob der momentane Stimmpegel angenommen werden sollte.
    • 23) Das Verfahren nach 13), wobei die Durchführungsschritte ein Durchführen einer Linearvorhersagecodierung (linear predictive coding) umfassen.
    • 24) Das Verfahren nach 13), wobei der Adaptierungsschritt Adaptieren der momentanen Codierungsoperation inkludiert, um eine beliebige einer Vielzahl von unterschiedlichen Adaptierungen der momentanen Codierungsoperation zu erzeugen.
    • 25) Das Verfahren nach 24), wobei der Adaptierungsschritt ein Auswählen umfasst, in Reaktion auf die momentan in der momentanen Codierungsoperation verwendete Information, einer der in dem Adaptierungsschritte zu erzeugenden Adaptierungen, und danach ein Bestimmen einer Differenz zwischen der ausgewählten Adaptierung und der momentanen Codierungsoperation.
    • 26) Das Verfahren nach 25), wobei der Adaptierungssschritt, falls die ausgewählte Adaption sich von der momentanen Codierungsoperation um mehr als eine Schwellgröße unterscheidet, ein Auswählen einer anderen Adaption umfasst, die sich weniger von der momentanen Codierungsoperation unterscheidet.
    • 27) Das Verfahren nach 13), wobei der letzterwähnte Durchführungsschritt ein Durchführen eines Anti-Sparseness (Anti-Spärlichkeits-) Filterns eines von einem algebraischen Codebuch empfangenen Signals inkludiert.
  • Gemäß einer anderen Ausführungsform kann eine Sprachkodierungsvorrichtung die folgenden Elemente aufweisen:
    • 28) Eine Sprachdecodierungsvorrichtung zum Erzeugen eines decodierten Sprachsignals aus einer codierten Darstellung eines ursprünglichen Sprachsignals, umfassend: einen Eingang zum Empfang der codierten Darstellung des ursprünglichen Sprachsignals; einen Ausgang zum Bereitstellen des decodierten Sprachsignals; einen Decoder, gekoppelt dem Eingang und dem Ausgang, zum selektiven Durchführen in der codierten Darstellung einer Decodierungsoperation, oder einer Adaption der Decodierungsoperation, um das decodierte Sprachsignal zu erzeugen; und einen Controller, gekoppelt mit dem Decoder, um von dort momentan durch den Decoder in der Decodierungsoperation verwendete Information zu empfangen und zu speichern, der Controller inkludierend einen Ausgang, gekoppelt mit dem Decoder und reagierend auf die momentan durch den Decoder in der Decodierungsoperation verwendete Information und auf vorhergehend durch den Decoder in der Decodierungsoperation verwendete vorhergehende Information, die vorhergehend durch den Controller gespeichert ist, um dem Decoder zu signalisieren, eine Adaption der Decodierungsoperation durchzuführen.
    • 29) Die Vorrichtung nach 28), wobei die momentan in der Decodierungsoperation verwendete Information eine Stimminformation inkludiert, die einen Stimmpegel des ursprünglichen Sprachsignals anzeigt.
    • 30) Die Vorrichtung nach 29), wobei die Decodierungsoperation und die Adaption davon eine adaptive Verstärkungsformcodierung inkludieren, und wobei die Stimminformation ein Verstärkungssignal inkludiert, das der adaptiven Verstärkungsformcodierung zugeordnet ist.
    • 31) Die Vorrichtung nach 29), wobei, der Controller einen Speicher inkludiert, zum Halten einer Aufzeichnung von vorhergehenden Stimmpegeln, wie sie durch die Stimminformation angezeigt sind, und eine Verfeinerungslogik, die betreibbar ist, wenn die Stimminformation anzeigt, dass ein momentaner Stimmpegel einen vorbestimmten Schwellwert überschreitet, um den momentanen Stimmpegel mit Bezug auf die vorhergehenden Stimmpegel zu bewerten um zu bestimmen, ob die Stimminformation, die den momentanen Stimmpegel anzeigt, durch den Controller verwendet werden sollte.
    • 32) Die Vorrichtung nach 28), wobei die momentan in der Decodierungsoperation verwendete Information eine Signalenergieinformation inkludiert, die eine Signalenergie im ursprünglichen Sprachsignal anzeigt.
    • 33) Die Vorrichtung nach 32), wobei die Decodierungsoperation und die Adaption davon eine feste Verstärkungsformcodierung inkludieren, und wobei die Signalenergieinformation ein Verstärkungssignal inkludiert, das der festen Verstärkungsformcodierung zugeordnet ist.
    • 34) Die Vorrichtung nach 32), wobei die momentan in der Decodierungsoperation verwendete Information eine Stimminformation inkludiert, die einen Stimmpegel des ursprünglichen Sprachsignals anzeigt.
    • 35) Die Vorrichtung nach 34), wobei der Controller einen Speicher inkludiert, zum Halten einer Aufzeichnung einer vorhergehenden Signalenergie, wie sie durch die Signalenergieinformation angezeigt ist, und eine Verfeinerungslogik, die betreibbar ist, wenn die Stimminformation anzeigt, dass ein momentaner Stimmpegel einen vorbestimmten Schwellwert überschreitet, um eine momentane Signalenergie mit Bezug auf die vorhergehende Signalenergie zu bewerten um zu bestimmen, ob die Stimminformation, die den momentanen Stimmpegel anzeigt, durch den Controller verwendet werden sollte.
    • 36) Die Vorrichtung nach 28), wobei die Decodierungsoperation und die Adaption davon ein Linearvorhersagecodieren (linear predictive coding), inkludieren.
    • 37) Die Vorrichtung nach 28), wobei der Decoder betreibbar ist, eine beliebige einer Vielzahl von unterschiedlichen Adaptionen der Decodierungsoperation durchzuführen, ansprechend auf die Controllerausgabe, und wobei der Controller eine Abbildungslogik mit einem Eingang inkludiert, um die momentan in der Decodierungsoperation verwendete Information zu empfangen, und einen Ausgang aufweist, der anzeigt, welche der Adaptionen dem Decoder signalisiert werden sollte.
    • 38) Die Vorrichtung nach 37, wobei der Controller eine weitere Logik inkludiert, gekoppelt mit dem Abbildungslogikausgang um zu bestimmen, ob sich die durch den Abbildungslogikausgang angezeigte Adaption um mehr als eine Schwellgröße von der Decodierungsoperation unterscheidet.
    • 39) Die Vorrichtung nach 28), wobei der Decoder ein algebraisches Codebuch inkludiert, und die Durchführung der Adaption Durchführen eines Anti-Spärlichkeits-Filterns in einem von dem algebraischen Codebuch empfangenen Signal inkludiert.
  • Gemäß einer anderen Ausführungsform kann ein Sprachkodierungsverfahren die folgenden Operationen inkludieren:
    • 40) Ein Sprachdecodierverfahren zum Erzeugen eines decodierten Sprachsignals aus einer codierten Darstellung eines ursprünglichen Sprachsignals, die Schritte umfassend: Empfangen der codierten Darstellung des ursprünglichen Sprachsignals; Durchführen einer momentanen Decodierungsoperation in der codierten Darstellung, um das decodierte Sprachsignal zu erzeugen; und in Reaktion auf momentan in der momentanen Decodierungsoperation verwendete Information und auf vorhergehend in der momentanen Decodierungsoperation verwendete Information, Adaptieren der momentanen Decodierungsoperation, um eine adaptierte Decodierungsoperation zu erzeugen; und Durchführen der adaptierten Decodierungsoperation in der codierten Darstellung.
    • 41) Das Verfahren nach 40), wobei die momentan in der momentanen Decodierungsoperation verwendete Information eine Stimminformation inkludiert, die einen Stimmpegel des ursprünglichen Sprachsignals anzeigt.
    • 42) Das Verfahren nach 41), wobei die Durchführungsschritte Durchführen einer adaptiven Verstärkungsformcodierung inkludieren, und wobei die Stimminformation ein Verstärkungssignal inkludiert, das der adaptiven Verstärkungsformcodierung zugeordnet ist.
    • 43) Das Verfahren nach 41), einschließlich eines Haltens einer Aufzeichnung von vorhergehenden Stimmpegeln, wie sie durch die Stimminformation angezeigt sind, und, falls die Stimminformation anzeigt, dass ein momentaner Stimmpegel eine vorbestimmte Schwelle überschreitet, Bewerten des momentanen Stimmpegels mit Bezug auf die vorhergehenden Stimmpegel.
    • 44) Das Verfahren nach 43), einschließlich einer Modifizierung der Stimminformation, die den momentanen Stimmpegel anzeigt, um einen anderen Stimmpegel anzuzeigen.
    • 45) Das Verfahren nach 44), wobei der andere Stimmpegel ein niedrigerer Stimmpegel ist.
    • 46) Das Verfahren nach 40), wobei die momentan in der momentanen Decodierungsoperation verwendete Information Signalenergieinformation inkludiert, die eine Signalenergie in dem ursprünglichen Sprachsignal anzeigt.
    • 47) Das Verfahren nach 46), wobei die Durchführungsschritte Durchführen einer festen Verstärkungsformcodierung inkludieren, und wobei die Signalenergieinformation ein Verstärkungssignal inkludiert, das der festen Verstärkungsformcodierung zugeordnet ist.
    • 48) Das Verfahren nach 46), wobei die momentan in der momentanen Decodierungsoperation verwendete Information Stimminformation inkludiert, die einen Stimmpegel des ursprünglichen Sprachsignals anzeigt.
    • 49) Das Verfahren nach 48), einschließlich eines Haltens einer Aufzeichnung einer vorhergehenden Signalenergie, wie sie durch die Signalenergieinformation angezeigt ist, und, falls die Stimminformation anzeigt, dass ein momentaner Stimmpegel eine vorbestimmte Schwelle überschreitet, Bewerten einer momentanen Signalenergie mit Bezug auf die vorhergehende Signalenergie um zu bestimmen, ob der momentane Stimmpegel angenommen werden sollte.
    • 50) Das Verfahren nach 40), wobei die Durchführungsschritte Durchführen einer Linearvorhersagecodierung (linear predictive coding) inkludieren.
    • 51) Das Verfahren nach 40), wobei der Adaptionsschritt Adaptieren der momentanen Decodierungsoperation inklu diert, um eine beliebige ausgewählte einer Vielzahl von unterschiedlichen Adaptionen der momentanen Decodierungsoperation zu erzeugen.
    • 52) Das Verfahren nach 51), wobei der Adaptionsschritt Auswählen inkludiert, in Reaktion auf die momentan in der momentanen Decodierungsoperation verwendete Information, einer der in dem Adaptierungsschritt zu erzeugenden Adaptionen, und danach Bestimmen einer Differenz zwischen der ausgewählten Adaption und der momentanen Decodierungsoperation.
    • 53) Das Verfahren nach 52), wobei der Adaptionsschritt, falls sich die ausgewählte Information von der momentanen Decodierungsoperation um mehr als eine Schwellgröße unterscheidet, ein Auswählen einer anderen Adaption inkludiert, die sich um weniger von der momentanen Decodierungsoperation unterscheidet.
    • 54) Das Verfahren nach 40), wobei der zuletzt erwähnte Durchführungsschritt Durchführen eines Anti-Spärlichkeits-Filterns eines von einem algebraischen Codebuch empfangenen Signals inkludiert.
  • Es kann eine drahtlose Sprachkommunikationsvorrichtung vorgesehen werden, angepasst für eine Ausführung des Sprachdecodierverfahrens in Übereinstimmung mit beliebigen von 40) – 54).
  • Es kann ferner eine drahtlose Sprachkommunikationsvorrichtung vorgesehen werden, angepasst zum Ausführen des Sprachcodierungsverfahrens in Übereinstimmung mit beliebigen von 13) – 27).
  • Es kann weiter noch eine drahtlose Sprachkommunikationsvorrichtung vorgesehen werden, umfassend die Sprachdecodierung vorrichtung in Übereinstimmung mit beliebigen von 28) – 39).
  • Außerdem kann eine drahtlose Sprachkommunikationsvorrichtung vorgesehen werden, umfassend die Sprachcodierungsvorrichtung in Übereinstimmung mit beliebigen von 1) – 12).

Claims (39)

  1. Sprachkodierungsvorrichtung, umfassend: einen Kodierungsabschnitt zum Empfangen von Eingangsinformation bezüglich eines unkodierten Signals, das ein ursprüngliches Sprachsignal darstellt, wobei der Kodierungsabschnitt einen Festkodierungsabschnitt (21) zum Empfangen der Eingangsinformation und Erzeugen einer ersten kodierten Signalschätzung (24) und einen adaptiven Kodierungsabschnitt (23) zum Empfangen der Eingangsinformation und Erzeugen einer zweiten kodierten Signalschätzung inkludiert; gekennzeichnet durch eine Steuervorrichtung (19), die mit dem Festkodierungsabschnitt (21) und dem adaptiven Kodierungsabschnitt (23) verbunden ist, zum Empfangen von Information (18), die Sprachcharakteristika des unkodierten Signals anzeigt, und zum Generieren eines Steuersignals (17), wobei die Steuervorrichtung eine weich adaptive Steuervorrichtung umfasst; einen Codemodifizierer (16) zum Empfangen der ersten kodierten Signalschätzung (24) von dem Festkodierungsabschnitt (21) und des Steuersignals (17) von der Steuervorrichtung und Erzeugen einer modifizierten Signalschätzung (26); und einen Synthesizerabschnitt (28) zum Empfangen der modifizierten Signalschätzung (26) und Erzeugen eines kodierten Signals, das das ursprüngliche Sprachsignal darstellt.
  2. Sprachkodierungsvorrichtung nach Anspruch 1, gekennzeichnet durch: einen Summierungsabschnitt zum Summieren der modifizierten Signalschätzung und der zweiten kodierten Signalschätzung und Erzeugen einer summierten Signalschätzung; und den Synthesizerabschnitt, der die summierte Signalschätzung empfängt und ein kodiertes Signal erzeugt, das das ursprüngliche Sprachsignal darstellt.
  3. Sprachkodierungsvorrichtung nach Anspruch 1, gekennzeichnet dadurch, dass die Information, die Sprachcharakteristika des unkodierten Signals anzeigt, ferner eine Festcodeverstärkung von einem Festverstärkungsformkodierungsabschnitt und eine adaptive Codeverstärkung von einem adaptiven Verstärkungsformkodierungsabschnitt umfasst.
  4. Sprachkodierungsvorrichtung nach Anspruch 1, gekennzeichnet dadurch, dass der Codemodifizierer eine Vielzahl von Codemodifikationsebenen umfasst, wobei jede aus der Vielzahl von Codemodifikationsebenen selektiv betriebsfähig ist, eine unterschiedliche Ebene von Modifikation an der ersten kodierten Signalschätzung durchzuführen.
  5. Sprachkodierungsvorrichtung nach Anspruch 4, gekennzeichnet dadurch, dass der Codemodifizierer ferner Umschaltmittel zum Auswählen einer aus der Vielzahl von Codemodifikationsebenen basierend auf dem Steuersignal umfasst.
  6. Sprachkodierungsvorrichtung nach Anspruch 4, gekennzeichnet dadurch, dass die Steuervorrichtung das Steuersignal basierend auf mindestens einem vorherigen Wert der adaptiven Codeverstärkung generiert.
  7. Sprachkodierungsvorrichtung nach Anspruch 1, gekennzeichnet dadurch, dass die Steuervorrichtung das Steuersignal basierend auf dem Auftreten eines Sprachbeginns des ursprünglichen Sprachsignals generiert.
  8. Sprachkodierungsvorrichtung nach Anspruch 1, gekennzeichnet dadurch, dass der Codemodifizierer einen Anti-Spärlichkeitsfilter umfasst, wobei der Anti-Spärlichkeitsfilter eine Anti-Spärlichkeitsoperation auf die erste kodierte Signalschätzung hin durchführt, um die modifizierte Signalschätzung zu erzeugen.
  9. Sprachkodierungsvorrichtung nach Anspruch 8, gekennzeichnet dadurch, dass der Anti-Spärlichkeitsfilter einen Konvoluter zum Durchführen einer zirkularen Faltung der ersten kodierten Signalschätzung und einer Impulsantwort, die zu dem Anti-Spärlichkeitsfilter gehört, umfasst, um die modifizierte Signalschätzung zu erzeugen.
  10. Sprachkodierungsvorrichtung nach Anspruch 4, gekennzeichnet dadurch, dass jede aus der Vielzahl von Codemodifikationsebenen einen Anti-Spärlichkeitsfilter umfasst, der betriebsfähig ist, eine unterschiedliche Ebene von Anti-Spärlichkeitsmodifikation an der ersten kodierten Signalschätzung durchzuführen.
  11. Sprachkodierungsvorrichtung nach Anspruch 1, gekennzeichnet dadurch, dass der adaptive Kodierungsabschnitt einen adaptiven Verstärkungsformkodierungsabschnitt umfasst.
  12. Sprachkodierungsvorrichtung nach Anspruch 1, gekennzeichnet dadurch, dass die Sprachkodierungsvorrichtung einen linearen vorhersagenden Sprachkodierer umfasst.
  13. Sprachkodierungsverfahren zum Erzeugen einer kodierten Darstellung eines ursprünglichen Sprachsignals, wobei das Sprachkodierungsverfahren die Schritte umfasst: Empfangen von Eingangsinformation bezüglich eines unkodierten Sprachsignals, das das ursprüngliche Sprachsignal darstellt; Erzeugen aus der Eingangsinformation einer ersten kodierten Signalschätzung von einem Festkodierungsabschnitt und einer zweiten kodierten Signalschätzung von einem adaptiven Kodierungsabschnitt; Generieren eines Steuersignals basierend auf Information, die Sprachcharakteristika des unkodierten Signals anzeigt, aus den ersten und zweiten kodierten Signalschätzungen; Modifizieren der ersten kodierten Signalschätzung basierend auf dem Steuersignal, um eine modifizierte Signalschätzung zu erzeugen; und Synthetisieren eines kodierten Signals, das das ursprüngliche Sprachsignal darstellt, aus der modifizierten Signalschätzung.
  14. Sprachkodierungsverfahren nach Anspruch 13, gekennzeichnet dadurch, dass der Schritt zum Modifizieren ferner den Schritt umfasst: Auswählen einer Modifikationsebene aus einer Vielzahl von Modifikationsebenen basierend auf dem Steuersignal, wodurch das Modifizieren in Übereinstimmung mit der gewählten Modifikationsebene durchgeführt wird.
  15. Sprachkodierungsverfahren nach Anspruch 1, gekennzeichnet dadurch, dass der Schritt zum Modifizieren ferner den Schritt zum Durchführen einer Anti-Spärlichkeitsoperation auf die erste kodierte Signalschätzung hin umfasst.
  16. Sprachkodierungsverfahren nach Anspruch 15, gekennzeichnet dadurch, dass der Schritt zum Durchführen einer Anti-Spärlichkeitsoperation den Schritt zum Falten der ersten kodierten Signalschätzung und einer Impulsantwort, die mit einem Anti-Spärlichkeitsfilter in Verbindung steht, umfasst.
  17. Sprachdekodierungsvorrichtung, umfassend: einen Kodierungsabschnitt zum Empfangen von Eingangsinformation bezüglich eines kodierten Signals, das ein ursprüngliches Sprachsignal darstellt, wobei der Kodierungsabschnitt einen Festkodierungsabschnitt zum Erzeugen einer ersten kodierten Signalschätzung und einen adaptiven Kodierungsabschnitt zum Erzeugen einer zweiten kodierten Signalschätzung inkludiert; gekennzeichnet durch eine Steuervorrichtung, die mit dem Festkodierungsabschnitt und dem adaptiven Kodierungsabschnitt verbunden ist, zum Empfangen von Information, die Sprachcharakteristika des kodierten Signals anzeigt, und zum Generieren eines Steuersignals, wobei die Steuervorrichtung eine weich adaptive Steuervorrichtung umfasst; einen Codemodifizierer zum Empfangen der ersten kodierten Signalschätzung und des kodierten Steuersignals und Erzeugen einer modifizierten Signalschätzung; und einen Synthesizerabschnitt zum Empfangen der modifizierten Signalschätzung und Erzeugen eines dekodierten Signals, das das ursprüngliche Sprachsignal darstellt.
  18. Sprachdekodierungsvorrichtung nach Anspruch 17, ferner umfassend: einen Summierungsabschnitt zum Summieren der modifizierten Signalschätzung und der zweiten kodierten Signalschätzung, und Erzeugen einer summierten Signalschätzung; und einen Synthesizerabschnitt, der die summierten Signalschätzung empfängt und ein unkodiertes Signal erzeugt, das das ursprüngliche Sprachsignal darstellt.
  19. Sprachdekodierungsvorrichtung nach Anspruch 17, gekennzeichnet dadurch, dass die Information, die Sprachcharakteristika des kodierten Signals anzeigt, ferner eine Festcodeverstärkung von einem Festverstärkungsformkodierungsabschnitt und eine adaptive Codeverstärkung von einem adaptiven Verstärkungsformkodierungsabschnitt umfasst.
  20. Sprachdekodierungsvorrichtung nach Anspruch 17, gekennzeichnet dadurch, dass der Codemodifizierer eine Vielzahl von Codemodifikationsebenen umfasst, wobei jede aus der Vielzahl von Codemodifikationsebenen selektiv betriebsfähig ist, eine unterschiedliche Ebene von Modifikation an der ersten kodierten Signalschätzung durchzuführen.
  21. Sprachdekodierungsvorrichtung nach Anspruch 20, gekennzeichnet dadurch, dass der Codemodifizierer ferner Umschaltmittel zum Auswählen einer aus der Vielzahl von Co demodifikationsebenen basierend auf dem Steuersignal umfasst.
  22. Sprachdekodierungsvorrichtung nach Anspruch 20, gekennzeichnet dadurch, dass die Steuervorrichtung das Steuersignal basierend auf der Festcodeverstärkung und der adaptiven Codeverstärkung generiert.
  23. Sprachdekodierungsvorrichtung nach Anspruch 20, gekennzeichnet dadurch, dass die Steuervorrichtung das Steuersignal basierend auf mindestens einem vorherigen Wert der adaptiven Codeverstärkung generiert.
  24. Sprachdekodierungsvorrichtung nach Anspruch 19, gekennzeichnet dadurch, dass die Steuervorrichtung das Steuersignal basierend auf dem Auftreten eines Sprachbeginns des ursprünglichen Sprachsignals generiert.
  25. Sprachdekodierungsvorrichtung nach Anspruch 25, gekennzeichnet dadurch, dass der Codemodifizierer einen Anti-Spärlichkeitsfilter umfasst, wobei der Anti-Spärlichkeitsfilter eine Anti-Spärlichkeitsoperation auf die erste kodierte Signalschätzung hin durchführt, um die modifizierte Signalschätzung zu erzeugen.
  26. Sprachdekodierungsvorrichtung nach Anspruch 25, gekennzeichnet dadurch, dass der Anti-Spärlichkeitsfilter einen Konvoluter zum Durchführen einer zirkularen Faltung der ersten kodierten Signalschätzung und einer Impulsantwort, die mit dem Anti-Spärlichkeitsfilter in Verbindung steht, umfasst, um die modifizierte Signalschätzung zu erzeugen.
  27. Sprachdekodierungsvorrichtung nach Anspruch 20, gekennzeichnet dadurch, dass jede aus der Vielzahl von Codemodifikationsebenen einen Anti-Spärlichkeitsfilter umfasst, der betriebsfähig ist, eine unterschiedliche Ebene von Anti-Spärlichkeitsmodifikation an der ersten kodierten Signalschätzung durchzuführen.
  28. Sprachdekodierungsvorrichtung nach Anspruch 17, gekennzeichnet dadurch, dass der adaptive Kodierungsabschnitt einen adaptiven Verstärkungsformkodierungsabschnitt umfasst.
  29. Sprachdekodierungsvorrichtung nach Anspruch 17, gekennzeichnet dadurch, dass die Sprachdekodierungsvorrichtung einen linearen vorhersagenden Sprachkodierer umfasst.
  30. Sprachdekodierungsverfahren zum Erzeugen eines dekodierten Signals, das ein ursprüngliches Sprachsignal darstellt, aus einem kodierten Signal, wobei das Sprachdekodierungsverfahren die Schritte umfasst: Empfangen von Eingangsinformation bezüglich eines kodierten Signals, das das ursprüngliche Sprachsignal darstellt; Erzeugen aus der empfangenen Eingangsinformation einer ersten kodierten Signalschätzung von einem Festkodierungsabschnitt und einer zweiten kodierten Signalschätzung von einem adaptiven Kodierungsabschnitt; gekennzeichnet durch die Schritte: Generieren eines Steuersignals basierend auf Information, die Sprachcharakteristika des kodierten Signals anzeigt, aus den ersten und zweiten Signalschätzungen; Modifizieren der ersten kodierten Signalschätzung basierend auf dem Steuersignal, um eine modifizierte Signalschätzung zu erzeugen; und Synthetisieren eines dekodierten Signals, das das ursprüngliche Sprachsignal darstellt, aus der modifizierten Signalschätzung.
  31. Sprachdekodierungsverfahren nach Anspruch 30, gekennzeichnet dadurch, dass der Schritt zum Modifizieren ferner den Schritt umfasst: Auswählen einer Modifikationsebene aus einer Vielzahl von Modifikationsebenen basierend auf dem Steuersignal, wodurch das Modifizieren in Übereinstimmung mit der gewählten Modifikationsebene durchgeführt wird.
  32. Sprachdekodierungsverfahren nach Anspruch 30, gekennzeichnet dadurch, dass der Schritt zum Modifizieren ferner den Schritt zum Durchführen einer Anti-Spärlichkeitsoperation auf die erste kodierte Signalschätzung hin umfasst.
  33. Sprachkodierungsverfahren nach Anspruch 32, gekennzeichnet dadurch, dass der Schritt zum Durchführen einer Anti-Spärlichkeitsoperation den Schritt zum Falten der ersten kodierten Signalschätzung und einer Impulsantwort, die mit einem Anti-Spärlichkeitsfilter in Verbindung steht, umfasst.
  34. System zum Kodieren und Dekodieren eines Sprachsignals, das System umfassend: einen ersten Kodierungsabschnitt zum Empfangen erster Eingangsinformation bezüglich eines ersten unkodierten Signals, das ein ursprüngliches Sprachsignal darstellt, der erste Kodierungsabschnitt umfassend einen ersten Festkodierungsabschnitt zum Empfangen der ersten Ein gangsinformation und Erzeugen einer ersten kodierten Signalschätzung und einen ersten adaptiven Kodierungsabschnitt zum Empfangen der ersten Eingangsinformation und Erzeugen einer zweiten kodierten Signalschätzung; gekennzeichnet durch: eine erste Steuervorrichtung, die mit dem ersten Festkodierungsabschnitt und dem ersten adaptiven Kodierungsabschnitt verbunden ist, zum Empfangen von Information, die Sprachcharakteristika des ersten unkodierten Signals anzeigt, und zum Generieren eines ersten Steuersignals, wobei die erste Steuervorrichtung eine weich adaptive Steuervorrichtung umfasst; einen ersten Codemodifizierer zum Empfangen der ersten kodierten Signalschätzung und des ersten Steuersignals und Erzeugen einer ersten modifizierten Signalschätzung; einen ersten Synthesizerabschnitt zum Empfangen der ersten modifizierten Signalschätzung und Erzeugen eines kodierten Signals, das das ursprüngliche Sprachsignal darstellt; einen zweiten Kodierungsabschnitt zum Empfangen zweiter Eingangsinformation bezüglich des kodierten Signals, das das ursprüngliche Sprachsignal darstellt, der zweite Kodierungsabschnitt umfassend einen zweiten Festkodierungsabschnitt zum Empfangen der zweiten Eingangsinformation und Erzeugen einer dritten kodierten Signalschätzung, und einen zweiten adaptiven Kodierungsabschnitt zum Empfangen der zweiten Eingangsinformation und Erzeugen einer vierten kodierten Signalschätzung; eine zweite Steuervorrichtung, die mit dem zweiten Festkodierungsabschnitt und dem zweiten adaptiven Kodierungs abschnitt verbunden ist, zum Empfangen von Information, die Sprachcharakteristika des kodierten Signals anzeigt, und Generieren eines zweiten Steuersignals, die zweite Steuervorrichtung umfassend eine weich adaptive Steuervorrichtung; einen zweiten Codemodifizierer zum Empfangen der dritten kodierten Signalschätzung und des zweiten Steuersignals und Erzeugen einer zweiten modifizierten Signalschätzung; und einen zweiten Synthesizerabschnitt zum Empfangen der zweiten modifizierten Signalschätzung und Erzeugen eines dekodierten Signals, das das ursprüngliche Sprachsignal darstellt.
  35. Sprachkodierungs- und Dekodierungsverfahren, das Sprachkodierungs- und Dekodierungsverfahren die Schritte umfassend: Empfangen erster Eingangsinformation bezüglich eines ersten unkodierten Sprachsignals, das ein ursprüngliches Sprachsignal darstellt; Erzeugen aus der empfangenen ersten Eingangsinformation einer ersten kodierten Signalschätzung von einem ersten Festkodierungsabschnitt und einer zweiten Signalschätzung von einem ersten adaptiven Kodierungsabschnitt; gekennzeichnet durch: Generieren eines ersten Steuersignals basierend auf Information, die Sprachcharakteristika des unkodierten Sprachsignals anzeigt, aus den ersten und zweiten kodierten Signalschätzungen; Modifizieren der ersten kodierten Signalschätzung basierend auf dem ersten Steuersignal, um eine erste modifizierte Signalschätzung zu erzeugen; Synthetisieren eines kodierten Signals, das das ursprüngliche Sprachsignal darstellt, aus der ersten modifizierten Signalschätzung; Empfangen zweiter Eingangsinformation bezüglich des kodierten Signals; Erzeugen aus der empfangenen zweiten Eingangsinformation einer dritten kodierten Signalschätzung von einem zweiten Festkodierungsabschnitt und einer vierten kodierten Signalschätzung von einem zweiten adaptiven Kodierungsabschnitt; Generieren eines zweiten Steuersignals basierend auf Information, die Sprachcharakteristika des kodierten Signals anzeigt, aus den dritten und vierten kodierten Signalschätzungen; Modifizieren der dritten kodierten Signalschätzung basierend auf dem zweiten Steuersignal, um eine zweite modifizierte Signalschätzung zu erzeugen; und Synthetisieren eines dekodierten Signals, das das ursprüngliche Sprachsignal darstellt, aus der zweiten modifizierten Signalschätzung.
  36. Drahtlose Kommunikationseinrichtung, wobei die drahtlose Kommunikationseinrichtung eine Sprachkodierungsvorrichtung inkludiert, die Sprachkodierungsvorrichtung umfassend: einen Kodierungsabschnitt zum Empfangen von Eingangsinformation bezüglich eines unkodierten Signals, das ein unkodiertes Sprachsignal darstellt, der Kodierungsabschnitt inkludierend einen Festkodierungsabschnitt zum Empfangen der Eingangsinformation und Erzeugen einer ersten kodierten Signalschätzung, und einen adaptiven Kodierungsabschnitt zum Empfangen der Eingangsinformation und Erzeugen einer zweiten kodierten Signalschätzung, gekennzeichnet durch: eine Steuervorrichtung, die mit dem Festkodierungsabschnitt und dem adaptiven Kodierungsabschnitt verbunden ist, zum Empfangen von Information, die Sprachcharakteristika des unkodierten Signals anzeigt, und zum Generieren eines Steuersignals, die Steuervorrichtung umfassend eine weich adaptive Steuervorrichtung; einen Codemodifizierer zum Empfangen der ersten kodierten Signalschätzung von dem Festkodierungsabschnitt und des Steuersignals von der Steuervorrichtung und Erzeugen einer modifizierten Signalschätzung; und einen Synthesizerabschnitt zum Empfangen der modifizierten Signalschätzung und Erzeugen eines kodierten Signals, das das ursprüngliche Sprachsignal darstellt.
  37. Drahtlose Kommunikationseinrichtung, wobei die drahtlose Kommunikationseinrichtung eine Sprachdekodierungsvorrichtung inkludiert, die Sprachdekodierungsvorrichtung umfassend: einen Kodierungsabschnitt zum Empfangen von Eingangsinformation bezüglich eines kodierten Signals, das ein ur sprüngliches Sprachsignal darstellt, der Kodierungsabschnitt inkludierend einen Festkodierungsabschnitt zum Erzeugen einer ersten kodierten Signalschätzung und einen adaptiven Kodierungsabschnitt zum Erzeugen einer zweiten kodierten Signalschätzung, gekennzeichnet durch: eine Steuervorrichtung, die mit dem Festkodierungsabschnitt und dem adaptiven Kodierungsabschnitt verbunden ist, zum Empfangen von Information, die Sprachcharakteristika des kodierten Signals anzeigt, und zum Generieren eines Steuersignals, die Steuervorrichtung umfassend eine weich adaptive Steuervorrichtung; einen Codemodifizierer zum Empfangen der ersten kodierten Signalschätzung und des Steuersignals und Erzeugen einer modifizierten Signalschätzung; und einen Synthesizerabschnitt zum Empfangen der modifizierten Signalschätzung und Erzeugen eines dekodierten Signals, das das ursprüngliche Sprachsignal darstellt.
  38. Drahtlose Kommunikationseinrichtung, angepasst zum Ausführen eines Sprachkodierungsverfahrens nach Anspruch 13 zum Erzeugen einer kodierten Darstellung eines ursprünglichen Sprachsignals.
  39. Drahtlose Kommunikationseinrichtung, angepasst zum Ausführen eines Sprachdekodierungsverfahrens nach Anspruch 30 zum Erzeugen eines dekodierten Signals, das ein ursprüngliches Sprachsignal darstellt, aus einem kodierten Signal.
DE69925515T 1998-03-04 1999-03-02 Sprachkodierung unter Verwendung einer sanften Adaptation Expired - Lifetime DE69925515T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/034,590 US6058359A (en) 1998-03-04 1998-03-04 Speech coding including soft adaptability feature
US34590 1998-03-04

Publications (2)

Publication Number Publication Date
DE69925515D1 DE69925515D1 (de) 2005-06-30
DE69925515T2 true DE69925515T2 (de) 2006-02-09

Family

ID=21877362

Family Applications (2)

Application Number Title Priority Date Filing Date
DE69902233T Expired - Lifetime DE69902233T2 (de) 1998-03-04 1999-03-02 Sprachkodierung unter verwendung einer weichen adaptation
DE69925515T Expired - Lifetime DE69925515T2 (de) 1998-03-04 1999-03-02 Sprachkodierung unter Verwendung einer sanften Adaptation

Family Applications Before (1)

Application Number Title Priority Date Filing Date
DE69902233T Expired - Lifetime DE69902233T2 (de) 1998-03-04 1999-03-02 Sprachkodierung unter verwendung einer weichen adaptation

Country Status (8)

Country Link
US (2) US6058359A (de)
EP (2) EP1058927B1 (de)
JP (1) JP3378238B2 (de)
CN (2) CN1183513C (de)
AU (1) AU2756299A (de)
DE (2) DE69902233T2 (de)
RU (1) RU2239239C2 (de)
WO (1) WO1999045532A1 (de)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69708697T2 (de) * 1996-11-07 2002-08-01 Matsushita Electric Ind Co Ltd Verfahren zur Erzeugung eines Vektorquantisierungs-codebuchs, und Vorrichtung und Verfahren zur Sprachcodierung/-decodierung
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
KR100938017B1 (ko) * 1997-10-22 2010-01-21 파나소닉 주식회사 벡터 양자화 장치 및 방법
EP2154679B1 (de) * 1997-12-24 2016-09-14 BlackBerry Limited Verfahren und Vorrichtung zur Sprachkodierung
US6131047A (en) 1997-12-30 2000-10-10 Ericsson Inc. Radiotelephones having contact-sensitive user interfaces and methods of operating same
US6301556B1 (en) * 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
US6249758B1 (en) * 1998-06-30 2001-06-19 Nortel Networks Limited Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6438518B1 (en) * 1999-10-28 2002-08-20 Qualcomm Incorporated Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
US7016835B2 (en) * 1999-10-29 2006-03-21 International Business Machines Corporation Speech and signal digitization by using recognition metrics to select from multiple techniques
DE10009444A1 (de) * 2000-02-29 2001-09-06 Philips Corp Intellectual Pty Betriebsverfahren für ein Mobiltelefon
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
WO2004111996A1 (ja) * 2003-06-11 2004-12-23 Matsushita Electric Industrial Co., Ltd. 音響区間検出方法および装置
KR100546758B1 (ko) * 2003-06-30 2006-01-26 한국전자통신연구원 음성의 상호부호화시 전송률 결정 장치 및 방법
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US20090094026A1 (en) * 2007-10-03 2009-04-09 Binshi Cao Method of determining an estimated frame energy of a communication
CN101719814B (zh) 2009-12-08 2013-03-27 华为终端有限公司 确定带内信令译码模式的方法及装置
WO2012008891A1 (en) * 2010-07-16 2012-01-19 Telefonaktiebolaget L M Ericsson (Publ) Audio encoder and decoder and methods for encoding and decoding an audio signal
AU2012276367B2 (en) 2011-06-30 2016-02-04 Samsung Electronics Co., Ltd. Apparatus and method for generating bandwidth extension signal
CN103854653B (zh) 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
HU215861B (hu) * 1991-06-11 1999-03-29 Qualcomm Inc. Eljárások beszédjelek tömörítésére digitalizált minták változtatható sebességű kódolásával és dekódolásával, valamint eszközök ezen eljárások foganatosításához
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
CA2108623A1 (en) * 1992-11-02 1994-05-03 Yi-Sheng Wang Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop
SE501305C2 (sv) * 1993-05-26 1995-01-09 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
EP0654909A4 (de) * 1993-06-10 1997-09-10 Oki Electric Ind Co Ltd Celp kodierer und dekodierer.
DE69615227T2 (de) * 1995-01-17 2002-04-25 Nec Corp Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen
JPH08263099A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 符号化装置
US5692101A (en) * 1995-11-20 1997-11-25 Motorola, Inc. Speech coding method and apparatus using mean squared error modifier for selected speech coder parameters using VSELP techniques
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6029125A (en) * 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder

Also Published As

Publication number Publication date
AU2756299A (en) 1999-09-20
RU2239239C2 (ru) 2004-10-27
EP1058927A1 (de) 2000-12-13
WO1999045532A1 (en) 1999-09-10
DE69925515D1 (de) 2005-06-30
CN1555047A (zh) 2004-12-15
CN1183513C (zh) 2005-01-05
EP1058927B1 (de) 2002-07-24
JP3378238B2 (ja) 2003-02-17
CN1262992C (zh) 2006-07-05
EP1267329A1 (de) 2002-12-18
EP1267329B1 (de) 2005-05-25
US6058359A (en) 2000-05-02
JP2002506242A (ja) 2002-02-26
DE69902233D1 (de) 2002-08-29
DE69902233T2 (de) 2003-01-16
CN1292913A (zh) 2001-04-25
US6564183B1 (en) 2003-05-13

Similar Documents

Publication Publication Date Title
DE69925515T2 (de) Sprachkodierung unter Verwendung einer sanften Adaptation
DE69736446T2 (de) Audio Dekodierverfahren und -vorrichtung
DE19647298C2 (de) Kodiersystem
DE2945414C2 (de) Sprachsignal-Voraussageprozessor und Verfahren zur Verarbeitung eines Sprachleistungssignals
DE60201766T2 (de) Verbesserung der Periodizität der CELP-Anregung für die Sprachkodierung und -dekodierung
DE69839407T2 (de) Verfahren und Vorrichtung zum Generieren von Vektoren für die Sprachdekodierung
DE60222445T2 (de) Verfahren zum verbergen von bitfehlern für die sprachcodierung
DE69814517T2 (de) Sprachkodierung
DE69910239T2 (de) Verfahren und vorrichtung zur adaptiven bandbreitenabhängigen grundfrequenzsuche für die kodierung breitbandiger signale
DE19604273C2 (de) Verfahren und Vorrichtung zum Durchführen einer Suche in einem Kodebuch im Hinblick auf das Kodieren eines Klangsignales, Zellkommunikationssystem, Zellnetzwerkelement und mobile Zell-Sender-/Empfänger-Einheit
DE60209888T2 (de) Kodieren eines audiosignals
DE60012198T2 (de) Kodierung der hüllkurve des spektrums mittels variabler zeit/frequenz-auflösung
DE69832358T2 (de) Verfahren zur Sprachkodierung und -dekodierung
DE60021083T2 (de) Verfahren zur verbesserung der kodierungseffizienz eines audiosignals
DE69636209T2 (de) Vorrichtung zur Sprachkodierung
DE69828709T2 (de) Erhöhung der Dichte von kodierten Sprachsignalen
DE19715126C2 (de) Sprachsignal-Codiervorrichtung
DE60124079T2 (de) Sprachverarbeitung
EP1023777B1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE60028500T2 (de) Sprachdekodierung
DE3019823C2 (de)
DE69827313T2 (de) Verfahren zur Kodierung des Zufallskomponenten-Vektors in einem ACELP-Kodierer
WO1999063522A1 (de) Verfahren und anordnung zur sprachcodierung
DE69837296T2 (de) Verfahren und Vorrichtung zur Audiokodierung mittels einer mehrstufigen Mehrimpulsanregung
DE69630177T2 (de) Sprachkodierer mit der Fähigkeit zur wesentlichen Vergrösserung der Codebuchgrösse ohne aber die Zahl der übertragenen Bits zu vergrössern

Legal Events

Date Code Title Description
8364 No opposition during term of opposition