-
Die
vorliegende Erfindung betrifft ein Verfahren zur Störgeräuschreduktion
für Hörvorrichtungen durch Schätzen eines
Werts eines Eingangssignals mit einem Schätzalgorithmus.
Darüber hinaus betrifft die vorliegende Erfindung eine
entsprechende Hörvorrichtung mit einer Schätzeinrichtung
zum Schätzen eines Werts eines Eingangssignals mit einem Schätzalgorithmus
und einer Störgeräuschreduktionseinrichtung zum
Reduzieren eines Störgeräuschs in dem Eingangssignal.
Unter dem Begriff ”Hörvorrichtung” wird
hier jedes im oder am Ohr tragbare, schallausgebende Gerät,
insbesondere ein Hörgerät, ein Headset, Kopfhörer
und dergleichen, verstanden.
-
Hörgeräte
sind tragbare Hörvorrichtungen, die zur Versorgung von
Schwerhörenden dienen. Um den zahlreichen individuellen
Bedürfnissen entgegenzukommen, werden unterschiedliche
Bauformen von Hörgeräten wie Hinter-dem-Ohr-Hörgeräte (HdO),
Hörgerät mit externem Hörer (RIC: receiver
in the canal) und In-dem-Ohr-Hörgeräte (Ido),
z. B. auch Concha-Hörgeräte oder Kanal-Hörgeräte
(ITE, CIC), bereitgestellt. Die beispielhaft aufgeführten Hörgeräte
werden am Außenohr oder im Gehörgang getragen.
Darüber hinaus stehen auf dem Markt aber auch Knochenleitungshörhilfen,
implantierbare oder vibrotaktile Hörhilfen zur Verfügung.
Dabei erfolgt die Stimulation des geschädigten Gehörs
entweder mechanisch oder elektrisch.
-
Hörgeräte
besitzen prinzipiell als wesentliche Komponenten einen Eingangswandler,
einen Verstärker und einen Ausgangswandler. Der Eingangswandler
ist in der Regel ein Schallempfänger, z. B. ein Mikrofon,
und/oder ein elektromagnetischer Empfänger, z. B. eine
Induktionsspule. Der Ausgangswandler ist meist als elektroakustischer
Wandler, z. B. Miniaturlautsprecher, oder als elektromechanischer
Wandler, z. B. Knochenleitungshörer, realisiert. Der Verstärker
ist üblicher weise in eine Signalverarbeitungseinheit integriert.
Dieser prinzipielle Aufbau ist in 1 am Beispiel
eines Hinterdem-Ohr-Hörgeräts dargestellt. In
ein Hörgerätegehäuse 1 zum Tragen
hinter dem Ohr sind ein oder mehrere Mikrofone 2 zur Aufnahme
des Schalls aus der Umgebung eingebaut. Eine Signalverarbeitungseinheit 3,
die ebenfalls in das Hörgerätegehäuse 1 integriert
ist, verarbeitet die Mikrofonsignale und verstärkt sie.
Das Ausgangssignal der Signalverarbeitungseinheit 3 wird
an einen Lautsprecher bzw. Hörer 4 übertragen,
der ein akustisches Signal ausgibt. Der Schall wird gegebenenfalls über
einen Schallschlauch, der mit einer Otoplastik im Gehörgang
fixiert ist, zum Trommelfell des Geräteträgers übertragen.
Die Energieversorgung des Hörgeräts und insbesondere
die der Signalverarbeitungseinheit 3 erfolgt durch eine
ebenfalls ins Hörgerätegehäuse 1 integrierte
Batterie 5.
-
Bei
der Verarbeitung digitaler Sprachaufnahmen, z. B. digitalen Hörgeräten,
ist es oft wünschenswert, störende Hintergrundgeräusche
zu unterdrücken, ohne dabei das Nutzsignal (Sprache) zu
beeinflussen. Hierfür sind Filterverfahren, welche das Kurzzeitspektrum
des Signals beeinflussen, wie das Wiener-Filter, bekannt und geeignet.
Allerdings setzen diese Verfahren eine genaue Schätzung
der frequenzabhängigen Leistung des zu unterdrückenden Störgeräuschs
aus einem Eingangssignal voraus. Ist diese Schätzung ungenau,
wird entweder eine nicht zufriedenstellende Störgeräuschunterdrückung
erreicht, das Wunschsignal wird angegriffen oder es entstehen zusätzliche
künstlich erzeugte Störsignale, so genannte ”musical
tones”. Methoden zur Störgeräuschschätzung,
welche diese Probleme vollumfänglich und effizient lösen,
stehen noch nicht zur Verfügung.
-
Bislang
kann die Störgeräuschleistung prinzipiell durch
zwei Ansätze geschätzt werden. Beide Methoden
können entweder breitbandig oder bevorzugt in einer Frequenzbereichszerlegung
mittels Filterbank oder Kurzzeit-Fourier-Transformation stattfinden:
-
1. Sprachaktivitätserkennung:
-
Solange
keine Sprachaktivität festgestellt wird, betrachtet man
die komplette (zeitveränderliche) Eingangssignalleistung
als Störgeräusch. Sofern Sprachaktivität
detektiert wird, hält man die Störgeräuschschätzung
auf dem letzten, vor dem Einsetzen der Sprachaktivität
geschätzten, Wert konstant.
-
2. Störleistungsschätzung
während einer Sprachaktivität (so genanntes ”Minimum-Tracking-Verfahren”):
-
Es
ist bekannt, dass auch während einer Sprachaktivität
die Sprachsignalleistung in einzelnen Frequenzbereichen immer wieder
kurzfristig nahezu Null ist. Liegt nun eine Mischung aus Sprache
und vergleichsweise langsam zeitveränderlichem Störgeräusch
zugrunde, so entsprechen die Minima der zeitlich betrachteten spektralen
Signalleistung der Störgeräuschleistung zu diesen
Zeitpunkten. Zwischen den festgestellten Minima muss die Störsignalleistung
liegen (”Minimum-Tracking”). Ein derartiges Minimum-Tracking
kann beispielsweise mit Hilfe eines Glättungsfilters durchgeführt
werden, der beispielsweise beschrieben ist in R. Martin, "Noise
power spectral density estimation based an optimal smoothing and
minimum statistics", IEEE Trans. Speech Audio Processing,
Vol. 9, Nr. 5, Juli 2001, Seiten 504–512 oder S.
Rangachari, P. Loizou, "A noise-estimation algorithm for
highly non-stationary environments", Speech Communication,
Vol. 48, Februar 2006, Seiten 220–231. Die Ermittlung
der Störgeräuschleistung erfolgt typischerweise
getrennt für verschiedene Frequenzbereiche im Eingangssignal. Hierzu
wird das Eingangssignal zunächst mittels einer Filterbank
oder einer Fourier-Transformation in einzelne Frequenzkomponenten
aufgespalten. Diese Komponenten werden dann getrennt voneinander verarbeitet.
-
Bei
der oben genannten Methode 1, stellt einerseits die zuverlässige
Erkennung von Sprachaktivität ein Problem dar, und es ist
andererseits nicht möglich, zeitlich veränderliche Störgeräusche
während gleichzeitiger Sprachaktivität zu verfolgen.
-
Bei
der obigen Methode 2 sind grundsätzliche Widersprüche
in der Einstellung des Algorithmus zu lösen: Wenn Sprache
vorliegt, sollte die Störgeräuschschätzung
nur langsam angepasst werden, um nicht durch schnelle Adaption Sprachanteile
als Störgeräusche zu klassifizieren und hierdurch
die Sprachqualität anzugreifen. Liegt keine Sprache vor, so
sollte die Störleistungsschätzung ohne Verzögerung
der temporalen Feinstruktur des Eingangssignals folgen. Hieraus
ergeben sich für die Einstellparameter des Verfahrens,
wie z. B. Glättungszeitkonstanten, Fensterlänge
für eine Minimumsuche oder Gewichtungsfaktoren widersprüchliche
Anforderung, die bislang nur im Mittel optimal gelöst werden
konnten.
-
Die
Aufgabe der vorliegenden Erfindung besteht somit darin, die Qualität
einer Störgeräuschunterdrückung zu verbessern,
so dass insbesondere Sprache weniger angegriffen wird und störende
Artefakte besser vermieden werden.
-
Erfindungsgemäß wird
diese Aufgabe gelöst durch ein Verfahren zur Störgeräuschreduktion
für Hörvorrichtungen durch Schätzen eines
ersten Werts eines Eingangssignals mit einem ersten Schätzalgorithmus,
Parametrieren eines zweiten Schätzalgorithmus mit dem geschätzten
ersten Wert, Schätzen eines zweiten Werts des Eingangssignals
mit dem zweiten Schätzalgorithmus und Reduzieren eines Störgeräuschs
in dem Eingangssignal anhand des geschätzten zweiten Werts.
Dabei kann der erste Wert hier wie im Folgenden gleich dem zweiten
Wert sein.
-
Darüber
hinaus wird erfindungsgemäß bereitgestellt ein
Hörgerät bzw. eine Hörvorrichtung mit einer
ersten Schätzeinrichtung zum Schätzen eines ersten
Werts eines Eingangssignals mit einem ersten Schätzalgorithmus
und einer Störgeräuschreduktionseinrichtung zum
Reduzieren eines Störgeräuschs in dem Eingangssignal
sowie umfassend eine zweite Schätzeinrichtung, die mit
dem geschätzten ersten Wert parametriert ist, zum Schätzen
eines zweiten Werts des Eingangssignals mit einem zweiten Schätzalgorithmus,
wobei die Störgeräuschreduktionseinrichtung den
geschätzten zweiten Wert von der zweiten Schätzeinrichtung
zum Reduzieren des Störgeräuschs erhält.
-
Die
erfindungsgemäße zweistufige Schätzung
führt zu einer deutlich verbesserten Schätzqualität,
denn in der ersten Stufe kann eine einfache Schätzung durchgeführt
werden, deren Resultat zur Parametrierung der zweiten Schätzeinrichtung
bzw. des zweiten Schätzalgorithmus herangezogen wird. Der
zweite Schätzalgorithmus lässt sich so an eine spezifische
Störsituation anpassen, wodurch eine situationsspezifische
Schätzung erreicht werden kann.
-
Der
erste Schätzalgorithmus kann auf einem Minimum-Tracking-Verfahren
beruhen. Damit kann auf einfache Weise ein Störleistungsniveau
bei Sprachaktivität ermittelt werden.
-
Bei
einer speziellen Ausführungsform kann durch den ersten
Schätzalgorithmus eine zeitliche Veränderungsrate
des Eingangssignals als erster oder weiterer Wert zur Parametrierung
des zweiten Schätzalgorithmus geschätzt werden.
Damit kann die Gesamtleistung und die Störleistung zuverlässig
geschätzt werden.
-
Entsprechend
einer weiteren Ausführungsform kann der erste Schätzalgorithmus
und der zweite Schätzalgorithmus strukturell gleich sein.
Dies reduziert den Implementierungsaufwand. Insbesondere ist es
so möglich, dass die erste Schätzeinrichtung und
die zweite Schätzeinrichtung durch eine einzige Schätzeinrichtung
realisiert werden, die im Zeitmultiplex abwechselnd als erste und
zweite Schätzeinrichtung betrieben wird.
-
Die
beiden Schätzalgorithmen können aber auch unterschiedlich
sein. So kann der erste Schätzalgorithmus eine rekursive
Glättung beinhalten und der zweite Schätzalgorithmus
nicht rekursiv sein. Auf diese Weise kann der Implementierungsaufwand
an die gewünschte Schätzqualität angepasst
werden.
-
Vorzugsweise
ist der erste Wert, der mit dem ersten Schätzalgorithmus
geschätzt wird, eine Signalleistung, eine Störleistung
oder ein Signal-Stör-Verhältnis. Diese Größen
können direkt zur Dämpfung entsprechender Störungen
herangezogen werden.
-
Weiterhin
kann durch den ersten Schätzalgorithmus für mehrere
Frequenzbereiche selektiv jeweils ein erster Wert geschätzt
und diese ersten Werte zusammengefasst werden, um den zweiten Schätzalgorithmus
zu parametrieren. Damit ist es möglich, die Parametrierung
des zweiten Schätzalgorithmus anhand der spektralen Verteilung
des Eingangssignals zu beeinflussen.
-
Besonders
zu bevorzugen ist das dynamische Parametrieren des zweiten Schätzalgorithmus mit
einem ständig aktualisierten ersten Wert des ersten Schätzalgorithmus.
Damit kann die Störgeräuschreduktion ständig
angepasst an die aktuelle akustische Situation stets mit hoher Qualität
erfolgen.
-
Weiterhin
kann es bei dem beschriebenen Verfahren zur Störgeräuschreduktion
günstig sein, das Eingangsignal in einzelne Frequenzkomponenten
aufzuspalten und gegenüber dem nicht aufgespalteten Signal
in zeitlich unterabgetasteter Form zu verarbeiten. Mit dieser Abwärtstastung
kann der Rechnaufwand deutlich reduziert werden.
-
Die
vorliegende Erfindung ist anhand der beigefügten Zeichnungen
näher erläutert, in denen zeigen:
-
1 den
prinzipielle Aufbau eines Hörgeräts gemäß dem
Stand der Technik und
-
2 ein
Blockdiagramm einer Realisierungsform eines erfindungsgemäßen
Verfahrens.
-
Die
nachfolgend näher geschilderten Ausführungsbeispiele
stellen bevorzugte Ausführungsformen der vorliegenden Erfindung
dar.
-
Die
in 2 dargestellte Signalverarbeitungseinrichtung
eines Hörgeräts besitzt am Signaleingang eine
Anlaysefilterbank AFB. Sie verfügt über einen
breitbandigen Signaleingang BI und einen mehrkanaligen Ausgang CO.
In den breitbandigen Eingang BI wird ein gestörtes Nutzsignal
S eingespeist. Dieses Signal wird durch die Analysefilterbank AFB
spektral zerlegt. Das Ausgangssignal der Analysefilterbank AFB wird
an den Eingang I1 eines ersten Schätzers NS1, an einen
Eingang 12 eines zweiten Schätzers NS2 und an
einen Eingang I3 einer Störgeräuschreduktionseinrichtung
NR geführt. Der erste Schätzer NS1 schätzt
die Leistung des Störsignals und gibt sie als initiale
Störleistung am Ausgang NP1 aus. Außerdem schätzt
der Schätzer NS1 hier auch die Nutzsignalleistung und gibt
sie am Ausgang SP1 aus.
-
Der
zweite Schätzer NS2 nimmt neben dem Ausgangssignal der
Analysefilterbank AFB die initiale Störsignalleistung an
seinem Eingang NP2 und die initiale Nutzsignalleistung an seinem
Eingang SP2 auf. Die initiale Störsignalleistung und die
initiale Nutzsignalleistung werden dazu verwendet, um den adaptiven
Schätzer NS2 zu parametrieren. Mit der aktuellen Parametereinstellung
schätzt der zweite Schätzer eine finale Störsignalleistung,
die er an seinem Ausgang FNP2 ausgibt und optional auch eine finale
Nutzsignalleistung, die er an seinem Ausgang FSP2 ausgibt.
-
Die
dem adaptiven zweiten Schätzer NS2 nachgeschaltete Störsignalreduktionseinrichtung, die
beispielsweise als Wiener-Filter realisiert sein kann, nimmt die
finale Störsignalleistung an ihrem Eingang FNP3 und die
finale Nutzsignalleistung an ihrem Eingang FSP3 auf. Anhand dieser
Größen zusammen mit dem Ausgangssignal der Analysefilterbank
AFB berechnet der Störgeräuschreduktionsalgorithmus
der Störgeräuschreduktions einrichtung NR eine
Dämpfung bzw. Reduktionsverstärkung, die am Ausgang
RG ausgebeben wird.
-
Die
bevorzugt mehrkanalige Reduktionsverstärkung der Störgeräuschreduktionseinrichtung
NR wird zusammen mit dem mehrkanaligen Ausgangssignal der Analysefilterbank
einem Multiplizierer M zugeführt, der kanalweise eine Multiplikation
durchführt, so dass ein mehrkanaliges störgeräuschbefreites
Signal entsteht, welches einer Synthesefilterbank SFB speziell deren
mehrkanaligem Eingang CI zugeführt wird. Die Synthesefilterbank
SFB synthetisiert die Signale der einzelnen Kanäle zu einem
breitbandigen geräuschreduzierten Ausgangssignal SR. Dieses
Signal steht am Ausgang BO zur Verfügung.
-
Die
Störgeräuschbefreiung basiert also auf einer zweistufigen
Schätzung der Störsignalleistung. Dabei erfolgt
zunächst eine erste Schätzung der Gesamtleistung
bzw. der Nutzsignalleistung und der Störleistung in dem
ersten Schätzer NS1. Diese erste Schätzung kann
beispielsweise mittels eines fest parametrierten Mimimum-Tracking-Verfahrens,
wie es oben beschrieben wurde, erfolgen. Für die Schätzung
kann auch beispielsweise die zeitliche Veränderungsrate
des Eingangssignals als (gegebenenfalls zusätzliches) Kriterium
verwendet werden. Diese Veränderungsrate ist in dem Aufsatz F.
F. Quatieri, R. B. Dunn, "Speech enhancement based an auditory spectral
change", Proc. IEEE Int. Conf. Acoustics, Speech, Signal
Processing (ICASSP), Vol. I, 2002, Seiten 257 bis 260 unter
dem Stichwort ”spectral change” beschrieben.
-
Aufgrund
dieser Schätzung des ersten Schätzers NS1, z.
B. in Form eines Signal-Rauschverhältnisses (oder in einer
bevorzugten Ausführung in Form eines Rausch-Signalverhältnisses
bzw. der Signalleistung und/oder der Störleistung direkt,
werden Betriebsparameter des zweiten, parallel zu dem ersten betriebenen
Störschätzungsverfahrens in dem zweiten Schätzer
NS2 adaptiert.
-
Das
zweite Störschätzungsverfahren ist in einer bevorzugten
Ausführung strukturell dem ersten gleich und unterscheidet
sich nur durch die aufgrund der Ergebnisse des ersten Verfahrens
adaptiv veränderte Parametrierung. In dem zweiten Schätzer
kann beispielsweise eine Zeitkonstante eines Glätters so adaptiert
werden, dass bei geringem geschätzten Signal-Rauschverhältnis
eine schnellere Glättung erfolgt als bei hohem geschätztem
Signal-Rauschverhältnis.
-
In
dem zweiten Schätzer NS2 können weiterhin aufgrund
der Schätzgrößen aus dem ersten Schätzer
nicht nur ein Parameter, sondern auch mehrere Parameter verändert
werden. Die Änderung der Parameter des zweiten Störleistungsschätzers
NS2 kann direkt entsprechend der ersten Schätzung der Störleistung
frequenzabhängig erfolgen. Alternativ kann die Änderung
der Parameter des zweiten Störleistungsschätzers
auch aufgrund einer Zusammenfassung der ursprünglich frequenzselektiv
ermittelten ersten Störgeräuschschätzung
erfolgen. Dabei können die Änderungsbereiche und
Grenzwerte der Parameter des zweiten Störgeräuschschätzers
NS2 frequenzabhängig festgelegt werden. Insbesondere ist es
vorteilhaft, wenn die Änderungsbereiche und Grenzwerte
der zweiten Störgeräuschschätzers NS2 abhängig
von der ersten Schätzung dynamisch festgelegt werden.
-
Das
zweite Störgeräuschschätzverfahren bzw.
der zweite Störgeräuschschätzer kann
sich auch strukturell vom ersten unterscheiden. So kann z. B. im
ersten Verfahren eine rekursive Glättung (vergleiche R.
Martin a. a. O.) zum Einsatz kommen, während im
zweiten ein nicht rekursives Verfahren (vergleiche S. Rangachari,
P. Loizou a. a. O.) adaptiert wird oder umgekehrt.
-
Die
Aufspaltung des Eingangssignals in Frequenzkomponenten kann entweder
mittels einer (auch nichtgleichförmigen) Filterbank oder
mittels (Kurzzeit-)Fourier-Transformation erfolgen. Weiterhin kann
das in einzelne Frequenzkomponenten auf gespaltete Signal gegenüber
dem nicht aufgespalteten Signal in zeitlich unterabgetasteter Form
verarbeitet werden.
-
Durch
die erfindungsgemäße Kombination eines ersten
fest parametrierten Störgeräuschschätzers
mit einem zweiten, anhand von Schätzwerten des ersten Schätzers
und gegebenenfalls weiterer Kriterien zeitveränderlich
parametrierten Störgeräuschschätzers
kann eine Störgeräuschschätzung realisiert
werden, die nicht die nachteiligen Merkmale eines fest parametrierten
Störgeräuschschätzers hat und nicht die
explizite Schätzung von Sprachaktivität erfordert.
Insbesondere muss nicht ein Kompromiss zwischen langsamer Adaption
bei Vorliegen eines Sprachsignals und schneller Adaption, wenn keine Sprache
vorliegt, gefunden werden. Vielmehr kann durch die Anpassung der
Parameter insgesamt eine verbesserte Störgeräuschschätzung
und damit eine verbesserte Störgeräuschreduktion
erreicht werden, welche Sprache weniger angreift und gleichzeitig
störende Artefakte wie z. B. ”musical tones” signifikant verringert.
Gleichzeitig lässt sich die vorgeschlagene Lösung
effizient implementieren z. B. durch einen einzigen, im Zeitmultiplex
betriebenen Störgeräuschschätzer, was
den Einsatz in Geräten mit geringer Signalverarbeitungskapazität,
wie z. B. Hörgeräten, ermöglicht.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste
der vom Anmelder aufgeführten Dokumente wurde automatisiert
erzeugt und ist ausschließlich zur besseren Information
des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen
Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt
keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Nicht-Patentliteratur
-
- - R. Martin, ”Noise
power spectral density estimation based an optimal smoothing and
minimum statistics”, IEEE Trans. Speech Audio Processing, Vol.
9, Nr. 5, Juli 2001, Seiten 504–512 [0007]
- - S. Rangachari, P. Loizou, ”A noise-estimation algorithm
for highly non-stationary environments”, Speech Communication,
Vol. 48, Februar 2006, Seiten 220–231 [0007]
- - F. F. Quatieri, R. B. Dunn, ”Speech enhancement based
an auditory spectral change”, Proc. IEEE Int. Conf. Acoustics,
Speech, Signal Processing (ICASSP), Vol. I, 2002, Seiten 257 bis
260 [0030]
- - R. Martin a. a. O. [0034]
- - S. Rangachari, P. Loizou a. a. O. [0034]