EP0685836B1 - Procédé et dispositif de prétraitement d'un signal acoustique en amont d'un codeur de parole - Google Patents

Procédé et dispositif de prétraitement d'un signal acoustique en amont d'un codeur de parole Download PDF

Info

Publication number
EP0685836B1
EP0685836B1 EP95401261A EP95401261A EP0685836B1 EP 0685836 B1 EP0685836 B1 EP 0685836B1 EP 95401261 A EP95401261 A EP 95401261A EP 95401261 A EP95401261 A EP 95401261A EP 0685836 B1 EP0685836 B1 EP 0685836B1
Authority
EP
European Patent Office
Prior art keywords
signal
state
frame
energy
acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
EP95401261A
Other languages
German (de)
English (en)
Other versions
EP0685836A1 (fr
Inventor
Sophie Scott
William Navarro
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nortel Networks France SAS
Original Assignee
Matra Nortel Communications SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matra Nortel Communications SAS filed Critical Matra Nortel Communications SAS
Publication of EP0685836A1 publication Critical patent/EP0685836A1/fr
Application granted granted Critical
Publication of EP0685836B1 publication Critical patent/EP0685836B1/fr
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Definitions

  • the present invention relates to a method and a acoustic signal preprocessing device supplied to a speech coder. It applies in particular, but not exclusively, to improve the performance of encoders low-speed speech.
  • Low bit rate speech coders (typically 5 kbit / s for a sampling frequency of 8 kHz) give their best performance on signals presenting a "telephone" spectrum, that is to say in the band 300-3400 Hz and with a pre-emphasis in the high frequencies.
  • IRS Intermediate Reference System
  • This template has been defined for telephone handsets, both in input (microphone) than output (headphones).
  • the speech encoder input signal has a spectrum more "flat", for example when a hands-on installation free is used, using a response microphone in linear frequency.
  • the usual vocoders are designed to be independent of the input with which they function, and they are not informed of the characteristics of this entry. If microphones different characteristics are likely to be connected to the vocoder, or more generally if the vocoder is likely to receive acoustic signals with different spectral characteristics, it there are then cases where the vocoder is used sub-optimally.
  • a main purpose of this invention is to improve the performance of a vocoder by making them less dependent on features spectral signal intended for it.
  • the method according to the invention consists in subjecting the acoustic input signal to high-pass filtering, to compare the energy of the high pass filtered signal to that of the unfiltered signal to determine a signal state among a first state for which the energy of the filtered high pass signal is greater than a predetermined fraction of the energy of the unfiltered signal, and a second state for which the energy of the filtered high pass signal is lower at the predetermined fraction of the signal energy not filtered, and to send the filtered signal to the encoder input high pass subject to high emphasis frequencies when the signal is in its second state.
  • the high pass filter used is typically a 400 Hz abrupt cutoff filter, and the fraction predetermined energy is typically 85 to 95%.
  • the first signal state corresponds to IRS characteristics
  • the second state corresponds to a flatter spectrum of the input acoustic signal containing proportionally more energy at low frequencies.
  • a flat spectrum signal is preprocessed (high pass filtering and pre-emphasis) to make spectral characteristics closer to those of the IRS template.
  • the use of high pass filtering for determining the signal state has the advantage over low-pass filtering, to allow the signal to be used filtered to address it (after pre-emphasis) to the input of the vocoder.
  • the determined state of the signal cannot only be changed when the input acoustic signal, or the high pass filtered signal, has an energy greater than one predetermined threshold. In fact, otherwise (by example in a zone of silence or low ambient noise), signal energy is too low to be able to reliably assess its spectral characteristics.
  • the acoustic signal When the acoustic signal is digitized in frames successive, it is detected whether the signal included in each frame is in a first condition corresponding to first state or in a second condition corresponding to second state, and the state of the signal is determined on the basis frame by frame conditions, by not modifying the state determined that after several successive frames show a signal condition different from that corresponding to the previously determined state.
  • This introduces a kind hysteresis which allows variations to be taken into account of the speech signal spectral envelope, due to ambient noise or speech itself (the timbre of the voice is not constant). This reduces the risk of false determination of the signal state, which leads to a better quality of the coded signal and avoids introducing stamp discontinuities which could be due to untimely modifications of the determined state.
  • the pretreatment device includes a high-pass filter receiving the acoustic signal input, means to calculate the energies contained respectively in said acoustic signal and in the high pass filter output signal, means for comparison of calculated energies, and a filter of high frequency pre-emphasis, which input receives the output signal of the high pass filter, and the output of which delivers the signal sent to the encoder input when the comparison means reveal that the output signal from the high pass filter contains less than a fraction predetermined energy of said acoustic signal.
  • the two solid lines correspond to the framing of the IRS template defined for microphones in CCITT Recommendation P48.
  • an IRS type microphone signal has a strong attenuation in the lower part of the spectrum (between 0 and 300 Hz) and a relative emphasis in the high frequencies.
  • a linear type signal provided by example through the microphone of a hands-free system, presents a flatter spectrum, notably not having the strong attenuation at low frequencies (a typical example of such a linear type signal is illustrated by a line in dashes on the diagram in Figure 1).
  • Encoder 12 is a low encoder flow optimized for an IRS type input signal. he can be, among other things, a linear prediction coder with excitation by regular pulse vectors (RP-CELP), as described in document EP-A-0 347 307. The coder 12 has no prior knowledge of the source of the acoustic signal addressed to him.
  • RP-CELP regular pulse vectors
  • the acoustic input signal S I is the output signal from a microphone 13 which has been amplified and digitized by an analog-digital converter 14.
  • the signal is typically digitized at a rate of 8 kHz sampling, and put into successive 30 ms frames each containing 240 16-bit samples.
  • the pretreatment device 10 comprises a high-pass filter 16 receiving the input acoustic signal S I and delivering a filtered signal S I '.
  • the filter 16 is typically a digital filter of the bi-quad type having an abrupt cutoff at 400 Hz.
  • the energies E1 and E2 contained in each frame of the acoustic input signal S I and of the filtered signal S I ' are calculated by two units 17, 18 each carrying out the sum of the squares of the samples of each frame which it receives.
  • the calculated energies E1 and E2 are supplied to a comparison unit 20 which determines the state of the signal in the form of a bit Y which is equal to 0 when it is determined that the signal is of IRS type (state Y A ), and 1 when it is determined that the signal is rather of the linear type (state Y B ).
  • the output of the pretreatment device 10 connected to the input of the encoder 12 is constituted by a terminal of a switch 21, the other terminal of which is connected either to the input of the high-pass filter 16, or to the output of a pre-emphasis filter 22, according to the value of the bit Y delivered by the comparison unit 20.
  • H (z) 1- ⁇ / z
  • denotes a pre-emphasis coefficient which is typically of the order 0.4.
  • the comparison unit 20 is for example in accordance with the diagram illustrated in FIG. 3.
  • the energy E1 of each frame of the input signal S I is sent to the input of a threshold comparator 25 which delivers a bit Z of value 0 when the energy E1 is less than a predetermined energy threshold, and of value 1 when the energy E1 is greater than the threshold.
  • the energy threshold is typically of the order of -38 dB relative to the signal saturation energy.
  • the comparator 25 serves to inhibit the determination of the state of the signal when the latter contains too little energy to be representative of the characteristics of the source. In this case, the determined state of the signal remains unchanged.
  • the energies E1 and E2 are sent to a digital divider 26 which calculates the ratio E2 / E1 for each frame.
  • This E2 / E1 ratio is sent to another threshold comparator 27 which delivers a bit X of value 0 when the E2 / E1 ratio is greater than a predetermined threshold, and of value 1 when the E2 / E1 ratio is less than the threshold.
  • This threshold on the E2 / E1 ratio is typically of the order of 0.93.
  • Bit X is representative of a signal condition on each frame.
  • the state bit Y is not taken directly equal to the condition bit X, but it results from a processing of successive condition bits X by a state determination circuit 29.
  • the operation of the state determination circuit 29 is illustrated in FIG. 4, where the upper timing diagram illustrates an example of evolution of the bit X provided by the comparator 27.
  • the status bit Y (lower timing diagram) is initialized to 0 , because IRS characteristics are most frequently encountered.
  • variable V As soon as the variable V reaches a predetermined threshold (8 in the example considered), it is reset to 0 and the value of the bit Y is changed, so that it is determined that the signal has changed state.
  • a predetermined threshold 8 in the example considered
  • the signal is in state Y A up to frame M, in state Y B between frames M and N (change of signal source), then again in state Y A from frame N.
  • other modes of incrementation and decrementation and other threshold values would be usable.
  • the above counting mode can for example be obtained by circuit 29 shown in Figure 3.
  • This circuit includes a counter 32 on four bits, of which the bit most significant corresponds to the status bit Y, of which the three Least significant bits represent the counting variable V.
  • X and Y bits are supplied at the input of an OR gate EXCLUSIVE 33 whose output is addressed to the input incrementation of the counter 32 via a AND gate 34 whose other input receives the Z bit supplied by the threshold comparator 25.
  • the inverted output of the gate 33 is supplied to a decrementing input of the counter 32 via another AND gate 35 whose the other two inputs receive the Z bit respectively provided by comparator 25, and the output of an OR gate to three inputs 36 receiving the three least significant bits of the counter 32.
  • Counter 32 is arranged to split the pulses received on its decrement input when its least significant bit is 0 or when one at less than the next two bits is 1, as shown by the OR gate 37 in FIG. 3.
  • the circuit of determination 29 is not activated because AND gates 34, 35 prevent the value of counter 32 from being changed.

Description

La présente invention concerne un procédé et un dispositif de prétraitement du signal acoustique fourni à un codeur de parole. Elle s'applique notamment, mais non exclusivement, pour améliorer les performances des codeurs de parole à bas débit.
Les codeurs de parole à bas débit (typiquement 5 kbit/s pour une fréquence d'échantillonnage de 8 kHz) actuels donnent leur meilleure performance sur des signaux présentant un spectre "téléphonique", c'est-à-dire dans la bande 300-3400 Hz et avec une préaccentuation dans les fréquences élevées. Ces caractéristiques spectrales correspondent au gabarit IRS (Intermediate Reference System) défini par le CCITT dans la Recommandation P48. Ce gabarit a été défini pour les combinés téléphoniques, aussi bien en entrée (microphone) qu'en sortie (écouteurs).
Cependant, il arrive de plus en plus fréquemment que le signal d'entrée d'un codeur de parole présente un spectre plus "plat", par exemple lorsqu'une installation mains libres est utilisée, employant un microphone à réponse en fréquence linéaire. Les vocodeurs habituels sont conçus pour être indépendants de l'entrée avec laquelle ils fonctionnent, et ils ne sont d'ailleurs pas informés des caractéristiques de cette entrée. Si des microphones de caractéristiques différentes sont susceptibles d'être raccordés au vocodeur, ou plus généralement si le vocodeur est susceptible de recevoir des signaux acoustiques présentant des caractéristiques spectrales différentes, il y a alors des cas où le vocodeur est utilisé de façon sous-optimale.
Dans ce contexte, un but principal de la présente invention est d'améliorer les performances d'un vocodeur en les rendant moins dépendantes des caractéristiques spectrales du signal qui lui est destiné.
Le procédé selon l'invention consiste à soumettre le signal acoustique d'entrée à un filtrage passe-haut, à comparer l'énergie du signal filtré passe-haut à celle du signal non filtré pour déterminer un état du signal parmi un premier état pour lequel l'énergie du signal filtré passe-haut est supérieure à une fraction prédéterminée de l'énergie du signal non filtré, et un second état pour lequel l'énergie du signal filtré passe-haut est inférieure à la fraction prédéterminée de l'énergie du signal non filtré, et à adresser à l'entrée du codeur le signal filtré passe-haut soumis à une préaccentuation des hautes fréquences lorsque le signal est dans son second état.
Le filtre passe-haut utilisé est typiquement un filtre à coupure abrupte à 400 Hz, et la fraction énergétique prédéterminée est typiquement de 85 à 95%. Le premier état du signal correspond aux caractéristiques IRS, et le second état correspond à un spectre plus plat du signal acoustique d'entrée contenant proportionnellement plus d'énergie aux basses fréquences. Avec le procédé selon l'invention, un tel signal à spectre plat est prétraité (filtrage passe-haut et préaccentuation) pour rendre ses caractéristiques spectrales plus proches de celles du gabarit IRS. L'utilisation d'un filtrage passe-haut pour déterminer l'état du signal présente l'avantage, par rapport à un filtrage passe-bas, de permettre d'utiliser le signal filtré pour l'adresser (après préaccentuation) à l'entrée du vocodeur.
De préférence, l'état déterminé du signal ne peut être modifié que lorsque le signal acoustique d'entrée, ou le signal filtré passe-haut, a une énergie supérieure à un seuil prédéterminé. En effet, dans le cas contraire (par exemple en zone de silence ou de faible bruit ambiant), l'énergie du signal est trop faible pour qu'on puisse évaluer de façon fiable ses caractéristiques spectrales.
Lorsque le signal acoustique est numérisé en trames successives, on détecte si le signal inclus dans chaque trame est dans une première condition correspondant au premier état ou dans une seconde condition correspondant au second état, et on détermine l'état du signal sur la base des conditions trame par trame, en ne modifiant l'état déterminé qu'après que plusieurs trames successives montrent une condition de signal différente de celle correspondant à l'état précédemment déterminé. Ceci introduit une sorte d'hystérésis qui permet de prendre en compte les variations rapides de l'enveloppe spectrale du signal de parole, dues au bruit ambiant ou à la parole elle-même (le timbre de la voix n'est pas constant). On réduit ainsi les risques de fausse détermination de l'état du signal, ce qui conduit à une meilleure qualité du signal codé et évite d'introduire des discontinuités de timbre qui pourraient être dues à des modifications intempestives de l'état déterminé.
Le dispositif de prétraitement selon l'invention comprend un filtre passe-haut recevant le signal acoustique d'entrée, des moyens pour calculer les énergies contenues respectivement dans ledit signal acoustique et dans le signal de sortie du filtre passe-haut, des moyens de comparaison des énergies calculées, et un filtre de préaccentuation des hautes fréquences, dont l'entrée reçoit le signal de sortie du filtre passe-haut, et dont la sortie délivre le signal adressé à l'entrée du codeur lorsque les moyens de comparaison révèlent que le signal de sortie du filtre passe-haut contient moins qu'une fraction prédéterminée de l'énergie dudit signal acoustique.
D'autres particularités et avantages de la présente invention apparaítront dans la description ci-après d'un exemple de réalisation préféré mais non limitatif, en référence aux dessins annexés, dans lesquels :
  • la figure 1 est un diagramme illustrant les caractéristiques d'un signal acoustique de type IRS et d'un signal de type linéaire ;
  • la figure 2 est un schéma synoptique d'un dispositif de prétraitement selon l'invention ;
  • la figure 3 est un schéma plus détaillé des moyens de comparaison du dispositif de la figure 2 ; et
  • la figure 4 montre des chronogrammes illustrant le mode de détermination de l'état du signal par les moyens de la figure 3.
Sur la figure 1, les deux lignes en traits pleins correspondent à l'encadrement du gabarit IRS défini pour des microphones dans la Recommandation P48 du CCITT. On voit qu'un signal de microphone de type IRS présente une forte atténuation dans la partie basse du spectre (entre 0 et 300 Hz) et une relative accentuation dans les hautes fréquences. En comparaison, un signal de type linéaire, fourni par exemple par le microphone d'une installation mains libres, présente un spectre plus plat, n'ayant notamment pas la forte atténuation aux basses fréquences (un exemple typique d'un tel signal de type linéaire est illustré par une ligne en tirets sur le diagramme de la figure 1).
On tire parti de ces propriétés spectrales dans le dispositif de prétraitement 10 selon l'invention, schématisé sur la figure 2. Ce dispositif traite le signal d'entrée fourni par une source de signal acoustique pour l'adresser à un codeur de parole 12. Le codeur 12 est un codeur à bas débit optimisé pour un signal d'entrée de type IRS. Il peut être, entre autres, un codeur à prédiction linéaire à excitation par des vecteurs d'impulsions régulières (RP-CELP), tel que décrit dans le document EP-A-0 347 307. Le codeur 12 n'a pas de connaissance a priori de la source du signal acoustique qui lui est adressé.
Sur le schéma de la figure 2, le signal acoustique d'entrée SI est le signal de sortie d'un microphone 13 qui a été amplifié et numérisé par un convertisseur analogique-numérique 14. Le signal est typiquement numérisé à une cadence d'échantillonnage de 8 kHz, et mis sous forme de trames successives de 30 ms contenant chacune 240 échantillons de 16 bits.
Le dispositif de prétraitement 10 comprend un filtre passe-haut 16 recevant le signal acoustique d'entrée SI et délivrant un signal filtré SI'. Le filtre 16 est typiquement un filtre numérique de type bi-quad ayant une coupure abrupte à 400 Hz. Les énergies E1 et E2 contenues dans chaque trame du signal acoustique d'entrée SI et du signal filtré SI' sont calculées par deux unités 17, 18 effectuant chacune la somme des carrés des échantillons de chaque trame qu'elle reçoit. Les énergies calculées E1 et E2 sont fournies à une unité de comparaison 20 qui détermine l'état du signal sous la forme d'un bit Y qui vaut 0 lorsqu'il est déterminé que le signal est de type IRS (état YA), et 1 lorsqu'il est déterminé que le signal est plutôt de type linéaire (état YB).
La sortie du dispositif de prétraitement 10 reliée à l'entrée du codeur 12 est constituée par une borne d'un commutateur 21 dont l'autre borne est reliée soit à l'entrée du filtre passe-haut 16, soit à la sortie d'un filtre de préaccentuation 22, suivant la valeur du bit Y délivré par l'unité de comparaison 20. Lorsque Y = 0 (état YA), le commutateur 21 est dans la position représentée sur la figure 2, et le signal acoustique d'entrée SI est adressé à l'entrée du codeur 12. Dans l'autre position (Y = 1, état YB), c'est la sortie du filtre de préaccentuation 22 qui est adressée à l'entrée du codeur 12. Le filtre de préaccentuation 22 reçoit le signal filtré passe-haut SI' et lui applique une fonction de transfert de la forme H(z) = 1-β/z, dans laquelle β désigne un coefficient de préaccentuation qui est typiquement de l'ordre de 0,4. Ainsi, lorsque le signal acoustique est de type linéaire, il est transformé par filtrage passe-haut (filtre 16) et préaccentuation (filtre 22) pour être adressé à l'entrée du codeur 12 avec des caractéristiques spectrales plus proches de celles du gabarit IRS.
Etant donné que le filtre passe-haut 16 n'affecte que peu le signal d'entrée lorsque celui-ci a des caractéristiques IRS, il est également possible de fournir au codeur 12 le signal filtré passe-haut SI' lorsqu'on a déterminé que le signal est dans l'état YA correspondant aux caractéristiques IRS. Une variante du schéma de la figure 2 consiste alors à se dispenser du commutateur 21 en reliant directement la sortie du filtre de préaccentuation 22 à l'entrée du codeur 12, et à commander la valeur du coefficient β dans le filtre 22 en fonction de la valeur du bit d'état Y (par exemple β = 0 lorsque Y = 0 et β = 0,4 lorsque Y = 1).
L'unité de comparaison 20 est par exemple conforme au schéma illustré sur la figure 3. L'énergie E1 de chaque trame du signal d'entrée SI est adressée à l'entrée d'un comparateur à seuil 25 qui délivre un bit Z de valeur 0 lorsque l'énergie E1 est inférieure à un seuil d'énergie prédéterminé, et de valeur 1 lorsque l'énergie E1 est supérieure au seuil. Le seuil d'énergie est typiquement de l'ordre de -38 dB par rapport à l'énergie de saturation du signal. Le comparateur 25 sert à inhiber la détermination de l'état du signal lorsque celui-ci contient trop peu d'énergie pour être représentatif des caractéristiques de la source. Dans ce cas, l'état déterminé du signal reste inchangé.
Les énergies E1 et E2 sont adressées à un diviseur numérique 26 qui calcule le rapport E2/E1 pour chaque trame. Ce rapport E2/E1 est adressé à un autre comparateur à seuil 27 qui délivre un bit X de valeur 0 lorsque le rapport E2/E1 est supérieur à un seuil prédéterminé, et de valeur 1 lorsque le rapport E2/E1 est inférieur au seuil. Ce seuil sur le rapport E2/E1 est typiquement de l'ordre de 0,93. Le bit X est représentatif d'une condition du signal sur chaque trame. La condition X = 0 correspond aux caractéristiques IRS du signal d'entrée (état YA), et la condition X = 1 correspond aux caractéristiques linéaires (état YB). Pour éviter des changements d'état répétés et intempestifs à l'occasion des variations à court terme de l'excitation vocale, le bit d'état Y n'est pas pris directement égal au bit de condition X, mais il résulte d'un traitement des bits de condition successifs X par un circuit 29 de détermination d'état.
Le fonctionnement du circuit 29 de détermination d'état est illustré sur la figure 4, où le chronogramme supérieur illustre un exemple d'évolution du bit X fourni par le comparateur 27. Le bit d'état Y (chronogramme inférieur) est initialisé à 0, car les caractéristiques IRS sont le plus fréquemment rencontrées. On calcule trame après trame une variable de comptage V initialement mise à 0. La variable V est incrémentée d'une unité chaque fois que la condition X du signal sur une trame diffère de celle correspondant à l'état déterminé Y (X = 1 et Y = 0, ou X = 0 et Y = 1). Dans le cas contraire (X = Y = 0 ou 1) la variable V est décrémentée de deux unités si elle est différente de 0 et de 1, décrémentée d'une unité si elle est égale à 1, et maintenue inchangée si elle est égale à 0. Dès que la variable V atteint un seuil prédéterminé (8 dans l'exemple considéré), on la remet à 0 et on change la valeur du bit Y, de sorte qu'on détermine que le signal a changé d'état. Ainsi, dans l'exemple représenté sur la figure 4, le signal est dans l'état YA jusqu'à la trame M, dans l'état YB entre les trames M et N (changement de la source de signal), puis de nouveau dans l'état YA à partir de la trame N. Bien entendu, d'autres modes d'incrémentation et de décrémentation et d'autres valeurs de seuil seraient utilisables.
Le mode de comptage ci-dessus peut par exemple être obtenu par le circuit 29 représenté sur la figure 3. Ce circuit comprend un compteur 32 sur quatre bits, dont le bit de poids fort correspond au bit d'état Y, et dont les trois bits de poids faible représentent la variable de comptage V. Les bits X et Y sont fournis à l'entrée d'une porte OU EXCLUSIF 33 dont la sortie est adressée à l'entrée d'incrémentation du compteur 32 par l'intermédiaire d'une porte ET 34 dont l'autre entrée reçoit le bit Z fourni par le comparateur à seuil 25. Ainsi, la variable V est incrémentée lorsque X ≠ Y et Z = 1. La sortie inversée de la porte 33 est fournie à une entrée de décrémentation du compteur 32 par l'intermédiaire d'une autre porte ET 35 dont les deux autres entrées reçoivent respectivement le bit Z fourni par le comparateur 25, et la sortie d'une porte OU à trois entrées 36 recevant les trois bits de poids faible du compteur 32. Le compteur 32 est agencé pour dédoubler les impulsions reçues sur son entrée de décrémentation lorsque son bit de poids le plus faible vaut 0 ou lorsque l'un au moins des deux bits suivants vaut 1, comme schématisé par la porte OU 37 sur la figure 3. Ainsi, le compteur 32 est décrémenté (d'une unité si V = 1 et de deux unités si V > 1) lorsque X = Y et Z = 1 et V ≠ 0. Lorsque l'énergie du signal d'entrée est insuffisante, on a Z = 0 et le circuit de détermination 29 n'est pas activé car les portes ET 34, 35 empêchent de modifier la valeur du compteur 32.

Claims (8)

  1. Procédé de prétraitement d'un signal acoustique en amont d'un codeur de parole (12), caractérisé en ce qu'on soumet le signal acoustique (SI) à un filtrage passe-haut, on compare l'énergie (E2) du signal filtré passe-haut (SI') à celle (E1) du signal non filtré pour déterminer un état (Y) du signal parmi un premier état (YA) pour lequel l'énergie du signal filtré passe-haut est supérieure à une fraction prédéterminée de l'énergie du signal non filtré et un second état (YB) pour lequel l'énergie du signal filtré passe-haut est inférieure à la fraction prédéterminée de l'énergie du signal non filtré, et on adresse à l'entrée du codeur (12) le signal filtré passe-haut soumis à une préaccentuation des hautes fréquences lorsque le signal est dans son second état.
  2. Procédé selon la revendication 1, caractérisé en ce qu'on ne modifie pas l'état déterminé du signal lorsque ledit signal acoustique ou le signal filtré passe-haut a une énergie inférieure à un seuil prédéterminé.
  3. Procédé selon la revendication 1 ou 2, caractérisé en ce que le signal acoustique (SI) étant numérisé en trames successives, on détecte trame par trame si le signal est dans une première condition, correspondant au premier état (YA), pour laquelle l'énergie calculée (E2) de la trame du signal filtré passe-haut (SI') est supérieure à la fraction prédéterminée de l'énergie calculée (E1) de la trame du signal non filtré (SI) ou dans une seconde condition, correspondant au second état (YB), pour laquelle l'énergie calculée de la trame du signal filtré passe-haut est inférieure à la fraction prédéterminée de l'énergie calculée de la trame du signal non filtré, et on détermine l'état (Y) du signal sur la base des conditions trame par trame (X), en ne modifiant l'état déterminé qu'après que plusieurs trames successives montrent une condition de signal différente de celle correspondant à l'état précédemment déterminé.
  4. Procédé selon la revendication 3, caractérisé en ce qu'on incrémente une variable de comptage (V) lorsque la condition (X) du signal sur une trame diffère de celle correspondant à l'état déterminé (Y) du signal, en ce qu'on décrémente cette variable de comptage (V) lorsque la condition du signal sur une trame est celle correspondant à l'état déterminé du signal sauf si cette variable vaut zéro et en ce que, lorsque la variable de comptage (V) atteint un seuil prédéterminé, on la remet à zéro et on détermine que le signal a changé d'état.
  5. Dispositif (10) de prétraitement d'un signal acoustique en amont d'un codeur de parole (12), caractérisé en ce qu'il comprend un filtre passe-haut (16) recevant ledit signal acoustique (SI), des moyens (17,18) pour calculer les énergies (E1,E2) contenues respectivement dans ledit signal acoustique (SI) et dans le signal de sortie (SI') du filtre passe-haut, des moyens (20) de comparaison des énergies calculées, et un filtre (22) de préaccentuation des hautes fréquences, dont l'entrée reçoit le signal de sortie du filtre passe-haut, et dont la sortie délivre le signal adressé à l'entrée du codeur (12) lorsque les moyens de comparaison (20) révèlent que le signal de sortie du filtre passe-haut contient moins qu'une fraction prédéterminée de l'énergie dudit signal acoustique.
  6. Dispositif selon la revendication 5, caractérisé en ce que, le signal acoustique étant numérisé en trames successives, les énergies (E1,E2) sont calculées pour chaque trame par les moyens de calcul (17,18), et les moyens de comparaison (20) comprennent un comparateur (27) qui détecte trame par trame si le signal est dans une première ou une deuxième condition suivant que le rapport (E2/E1) entre l'énergie calculée du signal de sortie du filtre passe-haut (16) et l'énergie calculée dudit signal acoustique (SI) est supérieur ou, respectivement, inférieur à une valeur prédéterminée, et des moyens (29) pour déterminer un état (Y) du signal parmi des premier et second états (YA,YB) correspondant respectivement aux première et deuxième conditions du signal par trame, ces moyens (29) ne modifiant l'état déterminé du signal qu'après que le comparateur (27) indique pour plusieurs trames successives une condition de signal différente de celle correspondant à l'état précédemment déterminé, et le filtre de préaccentuation (22) n'étant utilisé pour filtrer le signal adressé à l'entrée du codeur (12) que lorsque les moyens (29) ont déterminé que le signal est dans son second état.
  7. Dispositif selon la revendication 6, caractérisé en ce que les moyens (29) de détermination de l'état du signal comprennent un compteur (32) calculant après chaque trame une variable de comptage (V) en l'incrémentant lorsque le comparateur (27) indique une condition de signal différente de celle correspondant à l'état déterminé du signal, en la décrémentant, sauf si elle vaut zéro, lorsque le comparateur (27) indique une condition de signal identique à celle correspondant à l'état déterminé du signal, et en la remettant à zéro lorsqu'elle atteint un seuil prédéterminé, l'état déterminé (Y) du signal étant modifié à chaque remise à zéro de la variable de comptage (V).
  8. Dispositif selon la revendication 6 ou 7, caractérisé en ce qu'il comprend un autre comparateur (25) qui compare l'énergie calculée dudit signal acoustique ou du signal filtré passe-haut à un seuil prédéterminé, pour n'activer les moyens (29) de détermination de l'état du signal que lorsque ledit seuil est dépassé.
EP95401261A 1994-06-03 1995-05-31 Procédé et dispositif de prétraitement d'un signal acoustique en amont d'un codeur de parole Expired - Lifetime EP0685836B1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9406824 1994-06-03
FR9406824A FR2720849B1 (fr) 1994-06-03 1994-06-03 Procédé et dispositif de prétraitement d'un signal acoustique en amont d'un codeur de parole.

Publications (2)

Publication Number Publication Date
EP0685836A1 EP0685836A1 (fr) 1995-12-06
EP0685836B1 true EP0685836B1 (fr) 1999-07-21

Family

ID=9463860

Family Applications (1)

Application Number Title Priority Date Filing Date
EP95401261A Expired - Lifetime EP0685836B1 (fr) 1994-06-03 1995-05-31 Procédé et dispositif de prétraitement d'un signal acoustique en amont d'un codeur de parole

Country Status (4)

Country Link
US (1) US5644679A (fr)
EP (1) EP0685836B1 (fr)
DE (1) DE69510865T2 (fr)
FR (1) FR2720849B1 (fr)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
US6799159B2 (en) * 1998-02-02 2004-09-28 Motorola, Inc. Method and apparatus employing a vocoder for speech processing

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3683767D1 (de) * 1986-04-30 1992-03-12 Ibm Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens.
FR2632758B1 (fr) * 1988-06-13 1991-06-07 Matra Communication Procede de codage et codeur de parole a prediction lineaire
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置

Also Published As

Publication number Publication date
DE69510865T2 (de) 2000-07-13
EP0685836A1 (fr) 1995-12-06
DE69510865D1 (de) 1999-08-26
FR2720849A1 (fr) 1995-12-08
FR2720849B1 (fr) 1996-08-14
US5644679A (en) 1997-07-01

Similar Documents

Publication Publication Date Title
EP0127718B1 (fr) Procédé de détection d'activité dans un système de transmission de la voix
EP0867856B1 (fr) "Méthode et dispositif de detection d'activité vocale"
EP2419900B1 (fr) Procede et dispositif d'evaluation objective de la qualite vocale d'un signal de parole prenant en compte la classification du bruit de fond contenu dans le signal
EP0139803B1 (fr) Procédé de reconstitution d'informations perdues dans un système de transmission numérique de la voix et système de transmission utilisant ledit procédé
EP2002428B1 (fr) Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
JP3423906B2 (ja) 音声の動作特性検出装置および検出方法
EP0932964B1 (fr) Procede et dispositif d'egalisation aveugle des effets d'un canal de transmission sur un signal de parole numerique
US20020120440A1 (en) Method and apparatus for improved voice activity detection in a packet voice network
EP0685833B1 (fr) Procédé de codage de parole à prédiction linéaire
US7167544B1 (en) Telecommunication system with error messages corresponding to speech recognition errors
EP0428445B1 (fr) Procédé et dispositif de codage de filtres prédicteurs de vocodeurs très bas débit
EP0906613B1 (fr) Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere"
SE470577B (sv) Förfarande och anordning för kodning och/eller avkodning av bakgrundsljud
EP0685836B1 (fr) Procédé et dispositif de prétraitement d'un signal acoustique en amont d'un codeur de parole
EP0692883A1 (fr) Procédé d'égalisation aveugle et son application à la reconnaissance de la parole
EP0043056A1 (fr) Procédé de détection de parole dans un signal de circuit téléphonique et détecteur de parole le mettant en oeuvre
EP0714088B1 (fr) Détection d'activité vocale
EP1229517A1 (fr) Méthode de reconnaissance de la parole avec normalisation de la variance dépendante du bruit
EP1021805B1 (fr) Procede et disposition de conditionnement d'un signal de parole numerique
CA1165917A (fr) Dispositif de mesure de l'attenuation d'un trajet de transmission
EP0776114A2 (fr) Appareil téléphonique avec volume réglable en fonction de bruit ambiant
US6633847B1 (en) Voice activated circuit and radio using same
US6735303B1 (en) Periodic signal detector
EP0989544A1 (fr) Dispositif et procédé de filtrage d'un signal de parole, récepteur et système de communications téléphonique
EP0337868B1 (fr) Procédé et dispositif de discrimination de signal

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): DE ES GB IT NL SE

17P Request for examination filed

Effective date: 19951118

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: MATRA NORTEL COMMUNICATIONS

GRAG Despatch of communication of intention to grant

Free format text: ORIGINAL CODE: EPIDOS AGRA

17Q First examination report despatched

Effective date: 19981112

GRAG Despatch of communication of intention to grant

Free format text: ORIGINAL CODE: EPIDOS AGRA

GRAH Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOS IGRA

GRAH Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOS IGRA

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): DE ES GB IT NL SE

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SE

Free format text: THE PATENT HAS BEEN ANNULLED BY A DECISION OF A NATIONAL AUTHORITY

Effective date: 19990721

Ref country code: NL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 19990721

Ref country code: ES

Free format text: THE PATENT HAS BEEN ANNULLED BY A DECISION OF A NATIONAL AUTHORITY

Effective date: 19990721

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 19990804

REF Corresponds to:

Ref document number: 69510865

Country of ref document: DE

Date of ref document: 19990826

ITF It: translation for a ep patent filed

Owner name: UFFICIO TECNICO ING. A. MANNUCCI

NLV1 Nl: lapsed or annulled due to failure to fulfill the requirements of art. 29p and 29m of the patents act
PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed
REG Reference to a national code

Ref country code: GB

Ref legal event code: IF02

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20040528

Year of fee payment: 10

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20050414

Year of fee payment: 11

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES;WARNING: LAPSES OF ITALIAN PATENTS WITH EFFECTIVE DATE BEFORE 2007 MAY HAVE OCCURRED AT ANY TIME BEFORE 2007. THE CORRECT EFFECTIVE DATE MAY BE DIFFERENT FROM THE ONE RECORDED.

Effective date: 20050531

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20051201

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20060531

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20060531