DE102006027673A1 - Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm - Google Patents

Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm Download PDF

Info

Publication number
DE102006027673A1
DE102006027673A1 DE102006027673A DE102006027673A DE102006027673A1 DE 102006027673 A1 DE102006027673 A1 DE 102006027673A1 DE 102006027673 A DE102006027673 A DE 102006027673A DE 102006027673 A DE102006027673 A DE 102006027673A DE 102006027673 A1 DE102006027673 A1 DE 102006027673A1
Authority
DE
Germany
Prior art keywords
signal
microphone
source
sub
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102006027673A
Other languages
English (en)
Inventor
Herbert Buchner
Robert Aichner
Walter Kellermann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Friedrich Alexander Univeritaet Erlangen Nuernberg FAU
Original Assignee
Friedrich Alexander Univeritaet Erlangen Nuernberg FAU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Friedrich Alexander Univeritaet Erlangen Nuernberg FAU filed Critical Friedrich Alexander Univeritaet Erlangen Nuernberg FAU
Priority to DE102006027673A priority Critical patent/DE102006027673A1/de
Priority to CN200780022297XA priority patent/CN101484938B/zh
Priority to AU2007260233A priority patent/AU2007260233B2/en
Priority to JP2009514695A priority patent/JP2009540378A/ja
Priority to US12/308,284 priority patent/US8090111B2/en
Priority to EP07764622A priority patent/EP2027581B1/de
Priority to DK07764622.2T priority patent/DK2027581T3/da
Priority to AT07764622T priority patent/ATE547788T1/de
Priority to PCT/EP2007/005182 priority patent/WO2007144147A1/en
Publication of DE102006027673A1 publication Critical patent/DE102006027673A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/028Voice signal separating using properties of sound source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Abstract

Ein Signaltrenner zum Bestimmen eines ersten Ausgangssignals, das einen Audioinhalt einer Nutzsignalquelle in einem ersten Mikrophonsignal beschreibt, und zum Bestimmen eines zweiten Ausgangssignals, das einen Audioinhalt der Nutzsignalquelle in einem zweiten Mikrophonsignal beschreibt, umfasst einen Quellentrenner zum Empfangen der zwei Mikrophonsignale und zum Trennen von Audioinhalten von zumindest zwei Signalquellen. Der Quellentrenner ist ausgelegt, um ein erstes Teilsignal zu erhalten, das im Wesentlichen einen Audioinhalt der ersten Signalquelle beschreibt und das das erste Ausgangssignal darstellt, und um ein zweites Teilsignal zu erhalten, das im Wesentlichen einen Audioinhalt einer zweiten Signalquelle beschreibt. Der Quellentrenner ist ausgelegt, um Parameter einer Verarbeitungsvorschrift zur Erzeugung des ersten Teilsignals aus dem Mikrophonsignal so einzustellen, dass eine Verzerrung des ersten Teilsignals gegenüber dem ersten Mikrophonsignal kleiner als eine Maximalverzerrung ist, und um Paramter einer Verarbeitungsvorschrift zur Erzeugung des zweiten Teilsignals aus den Mikrophonsignalen so einzustellen, dass eine Verzerrung des zweiten Teilsignals gegenüber dem zweiten Mikrophonsignal kleiner als eine Maximalverzerrung ist. Der Signaltrenner umfasst ferner einen Signalentferner zum Entfernen des zweiten Teilsignals aus dem zweiten Mikrophonsignal, um das zweite Ausgangssignal zu erhalten, in dem das zweite Teilsignal reduziert ist. Der Signaltrenner ...

Description

  • Die vorliegende Erfindung bezieht sich im Allgemeinen auf einen Signaltrenner zum Bestimmen eines ersten Ausgangssignals, das einen Audioinhalt einer Nutzsignalquelle in einem Mikrophonsignal beschreibt, und zum Bestimmen eines zweiten Ausgangssignals, das einen Audioinhalt der Nutzsignalquelle in einem zweiten Mikrophonsignal beschreibt, auf entsprechende Verfahren sowie auf ein entsprechendes Computerprogramm. Im Speziellen bezieht sich die vorliegende Erfindung auf eine Methode und ein Verfahren zur Wiederherstellung von Rauminformationen bei blinden Quellentrennungssystemen.
  • In vielen technischen Anwendungen ist es erforderlich, ein Eingangssignal derart zu verarbeiten, dass in einem Ausgangssignal Audioinhalte eines Nutz-Signalanteils im Wesentlichen unverändert gegenüber dem Eingangssignal enthalten sind, während hingegen Audioinhalte eines Stör-Signalanteils in dem Ausgangssignal reduziert sind.
  • Methoden zur blinden Quellentrennung (im Folgenden auch als BSS bzw. „blind source separation" bezeichnet) wurden entwickelt, um mehrere als statistisch unabhängig angenommene Signale von Punktquellen (z. B. Sprachsignale in einem Raum) zu trennen. Entsprechende Methoden sind beispielsweise in den Veröffentlichungen [1], [2], [3] und [4] beschrieben (vergleiche Literaturverzeichnis).
  • Mittels mehrerer Sensoren (z. B. Mikrophone) werden Faltungsmixturen der Punktquellen (bzw. Signalquellen) aufgenommen und mit nachgeschalter mehrkanaliger adaptiver Filterung entmischt. Diese Entmischung basiert darauf, dass die Ausgangssignale der mehrkanaligen adaptiven Filterung bis zu statistischen Momenten einer gewissen Ordnung wieder wechselseitig statistisch entkoppelt werden sollen. Zielsetzung der blinden Quellentrennung ist somit, dass idealerweise in jedem Ausgangskanal jeweils nur eines der Quellensignale (also ein Signal von einer Punktquelle bzw. Signalquelle) anliegt. Der Nachteil hierbei ist jedoch, dass durch die jeweils einkanalige Darstellung am Ausgang nach der Entmischung die räumliche Information über die Punktquellen (bzw. Signalquellen) verloren geht (insbesondere Pegelunterschiede und Laufzeitunterschiede zwischen den Sensoren).
  • Es wird allgemein das Ziel verfolgt, eine räumliche Information über eine räumliche Lage einer Punktquelle bzw. Signalquelle (am Ausgang einer Quellentrennung) wiederherzustellen. Es wurden auf dem genannten Gebiet bereits einige Arbeiten durchgeführt und veröffentlicht, wie im Folgenden beschrieben wird.
  • Die bekannten Ansätze weisen jedoch noch einige Einschränkungen auf, wie im Folgenden ebenso ausgeführt wird. Dies äußert sich vor allem bei Verwendung von BSS-Verfahren in realistischen Anwendungsszenarien, in denen an den Ausgängen der blinden Signaltrennung (also an den BSS-Ausgängen) jeweils zusätzlich zu einer gewünschten Punktquelle (bzw. Signalquelle) noch Restanteile der jeweils anderen Quellen (also beispielsweise von weiteren Punktquellen bzw. Signalquellen oder Störquellen) vorhanden sind.
  • Bei manchen gegenwärtigen Systemen nach dem Stand der Technik wird entweder auf eine Rauminformation verzichtet (vergleiche z. B. [1], [2], [3], [4]), oder eine räumliche Information wird durch eine nachgeschaltete Verarbeitung wiederhergestellt.
  • Hierzu sind aus der Literatur vier Verfahren bekannt:
    • 1. Die räumliche Information wird durch eine nachgeschaltete Filterung der BSS-Ausgangssignale mit künstlichen oder unabhängig von der BSS vorab ermittelten Raumcharakteristika (bzw. Raumimpulsantworten) erzeugt (vergleiche [6], [7], [8]). Beispielsweise zeigt die WO2004/006624 A1 (auch als [8] bezeichnet), Raumimpulsantworten aus einer Datenbank von kopfbezogenen Raumimpulsantworten (engl.: head-related transfer functions, HRTFs) auszuwählen.
    • 2. Bei bestimmten BSS-Verfahren ist es möglich, eine blinde Systemidentifikation durchzuführen (vergleiche [9], [10]), so dass die Rauminformation aus Entmischfiltern des BSS-Systems abgeleitet werden kann. Die räumliche Information kann wiederum durch eine nachgeschaltete Filterung der BSS-Ausgangssignale mit der identifizierten Raumcharakteristik erzeugt werden.
    • 3. Außerdem ist es auch bei Verfahren, die keine blinde Systemidentifikation durchführen, möglich, Rauminformation aus den Entmischfiltern des BSS-Systems abzuleiten. In [19] wurde eine Methode gezeigt, die diese Information durch eine nachgeschaltete Filterung benutzt und damit Ausgangssignale mit einer Raumcharakteristik erzeugt.
    • 4. Bei einem weiteren Konzept werden die ursprünglichen Sensorsignale zusammen mit den Ausgangssignalen einer mehrkanaligen Geräuschreduktion in einem Nachbearbeitungsblock verarbeitet (vergleiche [5]).
  • Eine mehrkanalige Geräuschreduktion ist wie eine blinde Quellentrennung (BSS) ebenfalls ein Verfahren zur Verbesserung von bestimmten gewünschten Signalen (Punktquellen bzw. Signalquellen), welches jedoch im Gegensatz zu BSS auf einer Stationaritätsannahme der jeweiligen Störquelle basiert (vergleiche z. B. [11]).
  • Wie beispielsweise in [5] gezeigt, werden bei dem genannten Ansatz die Ausgangskanäle des mehrkanaligen Geräuschreduktionssystems yP(n) mit jeweils einkanaligen adaptiven Filtern verbunden, welche als Referenzsignale dP(n) die verzögerten Mikrophonsignale miteinbeziehen (vergleiche 1 in [5]). Adaptive zeitdiskrete Filter stellen eine weit verbreitete Technik in der digitalen Signalverarbeitung dar (vergleiche [12]). Das bekannte Prinzip besteht darin, Filterkoeffizienten so zu bestimmen, dass das Ausgangssignal des Systems bei bekanntem Eingangssignal einem Referenzsignal angenähert wird (vergleiche [12]). Dies wird bei dem Konzept gemäß [5] erreicht durch eine Minimierung eines Fehlersignals eP(n) = dP(n) – yP(n) nach einem bestimmten Kriterium (z. B. nach einem mittleren quadratischen Fehler).
  • Mit den oben beschriebenen vier Verfahren wird eine räumliche Position einer gewünschten Punktquelle (bzw. Signalquelle) korrekt wiedergegeben. Allerdings haben alle drei beschriebenen Verfahren den Nachteil, dass zusätzlich zu der gewünschten Punktquelle auch die noch vorhandenen Restanteile der jeweils anderen Quellen (also der weiteren Signalquellen bzw. Störquellen) auf dieselbe räumliche Position abgebildet werden.
  • Ein weiteres Verfahren, das sowohl die räumliche Information der gewünschten Punktquelle berücksichtigt, als auch das Problem der Abbildung auf den gleichen Ort vermeiden soll, wurde in [13] vorgeschlagen. Der Ansatz gemäß [13] basiert auf einer gemeinsamen Optimierung von zwei oder mehr gekoppelten BSS-Kriterien. Dies führt auf zwei oder mehr nichtlinear miteinander verkoppelte Adaptionsgleichungen, wobei das Auffinden eines globalen Optimums nicht gewährleistet werden kann. Eine Implementierung des Verfahrens gemäß [13] hat ferner gezeigt, dass auch damit die gewünschte Punktquelle und die noch vorhandenen Restanteile der unterdrück ten Quellen (bzw. der weiteren Signalquellen oder Störquellen) auf den gleichen Ort abgebildet werden.
  • Ferner zeigt [15] ein Verfahren zur Erhaltung einer Zeitverzögerung zwischen zwei Kanälen für zwei-ohrige Hörhilfen durch die Verwendung einer auf einer Wiener-Filterung basierenden Geräuschverringerung. Gemäß [15] werden mehrere Mikrofonsignale zwei getrennten Mehrkanal-Wiener-Filtern zugeführt. Ein Ausgangssignal eines ersten Wiener-Filters, das einen Schätzwert für ein Rauschen darstellt, wird von einem ersten Mikrofonsignal subtrahiert. Ein Ausgangssignal eines zweiten Wiener-Filters, das einen weiteren Schätzwert für ein Rauschen darstellt, wird von einem zweiten Mikrofonsignal subtrahiert. Somit werden durch die Subtraktionen Ausgangssignale erhalten.
  • In Anbetracht des beschriebenen Stands der Technik ist es die Aufgabe der vorliegenden Erfindung, ein Konzept zur Signaltrennung zu schaffen, gemäß dem eine Mehrzahl von Ausgangssignalen basierend auf einer Mehrzahl von Eingangssignalen derart gebildet wird, dass die Ausgangssignale eine räumliche Position einer Nutzsignalquelle mit hinreichender Genauigkeit wiedergeben, dass Störsignale von Störsignalquellen in den Ausgangssignalen reduziert sind, und dass Störsignalreste von den Stör-Signalquellen nicht auf den Ort der Nutzsignalquelle abgebildet werden.
  • Diese Aufgabe wird durch einen Signaltrenner gemäß den Ansprüchen 1 oder 12, ein Verfahren gemäß den Ansprüchen 23 oder 24 sowie durch ein Computerprogramm gemäß Anspruch 25 gelöst.
  • Die vorliegende Erfindung schafft gemäß Anspruch 1 einen Signaltrenner zum Bestimmen eines ersten Ausgangssignals, das einen Audioinhalt einer Nutzsignalquelle in einem ersten Mikrophonsignal beschreibt, und zum Bestimmen eines zweiten Ausgangssignals, das einen Audioinhalt der Nutzsignalquelle in einem zweiten Mikrophonsignal beschreibt.
  • Es ist der Kerngedanke der vorliegenden Erfindung, dass es vörteilhaft ist, einen Quellentrenner so auszuführen, dass ein erstes von dem Quellentrenner geliefertes Teilsignal im Wesentlichen einen Audioinhalt einer ersten Signalquelle (Nutz-Signalquelle) darstellt (bzw. beschreibt), wobei ferner sichergestellt wird, dass das erste Teilsignal gegenüber einem ersten Eingangssignal des Quellentrenners (z. B. dem ersten Mikrophonsignal) so wenig wie möglich verzerrt ist. Durch die genannte Ausgestaltung des Quellentrenners entspricht somit das erste Teilsignal im Wesentlichen dem von der ersten Signalquelle (Nutz-Signalquelle) gelieferten Signalanteil in dem ersten Eingangssignal des Quellentrenners (also z. B. in dem ersten Mikrophonsignal). Ebenso wurde erkannt, dass es vorteilhaft ist, den Quellentrenner so auszugestalten, dass einzweites von dem Quellentrenner geliefertes Teilsignal im Wesentlichen einen Audioinhalt der zweiten Signalquelle (Stör-Signalquelle) repräsentiert, und dass ferner das zweite Teilsignal gegenüber dem zweiten Eingangssignal des Quellentrenners (z. B. gegenüber dem zweiten Mikrophonsignal) so wenig als möglich verzerrt ist. Damit entspricht das zweite Teilsignal im Wesentlichen einem Beitrag der zweiten Signalquelle (Stör-Signalquelle) zu dem zweiten Eingangssignal des Signaltrenners (z.B. dem zweiten Mikrophonsignal).
  • Somit stehen an den Ausgängen des Quellentrenners zwei Teilsignale zur Verfügung, wobei das erste Teilsignal im Wesentlichen den Audioinhalt der ersten Signalquelle (Nutz-Signalquelle) umfasst und gegenüber dem ersten Mikrophonsignal um höchstens eine Maximalverzerrung (oder so wenig als möglich) verzerrt ist, und wobei ferner das zweite Teilsignal im Wesentlichen ein Audiosignalinhalt der zweiten Signalquelle (Stör-Signalquelle) umfasst und um höchstens eine Maximalverzerrung (oder so wenig als möglich) gegenüber dem zweiten Mikrophonsignal verzerrt ist.
  • Folglich ist das erste Teilsignal unmittelbar als ein erstes Ausgangssignal nutzbar. Das zweite Teilsignal kann ferner direkt verwendet werden, um den Audioinhalt des zweiten Teilsignals aus dem zweiten Mikrophonsignal zu entfernen, wobei durch das Entfernen des zweiten Teilsignals aus dem zweiten Mikrophonsignal das zweite Ausgangssignal entsteht.
  • In der erfindungsgemäßen Weise wird erreicht, dass das erste Teilsignal gegenüber dem ersten Mikrophonsignal so wenig als möglich verzerrt ist. Folglich stimmt eine Phaseninformation des Audioinhalts der ersten Signalquelle in dem ersten Teilsignal mit einer Phaseninformation des Audioinhalts der ersten Signalquelle in dem ersten Mikrophonsignal überein. Eine Phaseninformation eines gegebenenfalls noch in dem ersten Teilsignal enthaltenen Rest-Anteils des Audioinhalts der zweiten Signalquelle weist im Übrigen aufgrund der Begrenzung der Verzerrung zwischen dem ersten Mikrophonsignal und dem ersten Teilsignal eine gleiche Phaseninformation auf wie der Audioinhalt der zweiten Signalquelle in dem ersten Mikrophonsignal. Durch die Begrenzung der Verzerrung bei der Bildung des Teilsignals wird somit erzielt, dass der Audioinhalt der zweiten Signalquelle in dem ersten Teilsignal bzw. in dem ersten Ausgangssignal auf einen anderen Ort (typischerweise auf den Ort der zweiten Signalquelle) abgebildet wird als der Audioinhalt der ersten Signalquelle.
  • Eine Verzerrung des Audioinhalts der zweiten Signalquelle in dem zweiten Teilsignal gegenüber dem zweiten Mikrophonsignal ist ferner ebenso begrenzt. Daher eignet sich das zweite Teilsignal hervorragend, um den Audioinhalt der zweiten Signalquelle aus dem zweiten Mikrophonsignal beispielsweise durch eine einfache Differenzbildung zu entfernen. Da nämlich das zweite Teilsignal im Wesentlichen dem Anteil der zweiten Signalquelle in dem zweiten Mikrophonsignal in unverzerrter Weise entspricht, stellt die Diffe renz zwischen dem zweiten Mikrophonsignal und dem zweiten Teilsignal im Wesentlichen den von der ersten Signalquelle stammenden Audioinhalt in dem zweiten Mikrophonsignal dar.
  • Da ferner das zweite Teilsignal gegenüber dem zweiten Mikrophonsignal nur begrenzt verzerrt bzw. in einer Phase verändert ist, repräsentiert das zweite Teilsignal die zweite Signalquelle an ihrer korrekten räumlichen Position. Somit wird durch den Signalentferner der Audioinhalt der zweiten Signalquelle räumlich korrekt entfernt, wodurch der Rest-Anteil des Audioinhalts der zweiten Signalquelle in dem zweiten Ausgangssignal minimiert wird.
  • In dem zweiten Teilsignal ist ferner ein Rest-Signalanteil der ersten Signalquelle in Bezug auf das zweite Eingangssignal (z.B. das zweite Mikrofonsignal) räumlich korrekt dargestellt. Dadurch wird vermieden, dass bei einem Entfernen des zweiten Teilsignals aus dem zweiten Mikrofonsignal (z.B. durch Differenzbildung) durch den Rest-Signalanteil der ersten Signalquelle ein räumlich falsch lokalisierter Anteil des Audioinhalts der ersten Signalquelle eingeführt wird.
  • Ferner kann durch die erfindungsgemäße Ausgestaltung des Quellentrenners der Signalentferner besonders einfach ausgelegt werden, da die Verzerrung zwischen dem zweiten Mikrophonsignal und dem zweiten Teilsignal durch den Quellentrenner begrenzt ist.
  • Der erfindungsgemäße Signaltrenner bietet somit den wesentlichen Vorteil, dass aufgrund der Begrenzung der Signalverzerrung in dem Quellentrenner die Ausgangssignale des Quellentrenners unmittelbar und ohne eine weitere Nachverarbeitung eine räumliche Lage der ersten Signalquelle und der zweiten Signalquelle beschreiben. Während das erste Teilsignal unmittelbar den von der Signalquelle stammenden Anteil in dem ersten Mikrophonsignal beschreibt, wird der Anteil der ersten Signalquelle in dem zweiten Mikrophonsig nal durch ein einfaches Entfernen des zweiten Teilsignals aus dem zweiten Mikrophonsignal erhalten. Das erste Ausgängssignal und das zweite Ausgangssignal beschreiben somit in korrekter Weise eine räumliche Lage der ersten Signalquelle, wie sie an den Orten der Schallaufnehmer wahrnehmbar ist, wobei Störungen durch die zweite Signalquelle in den Ausgangssignalen weitgehend unterdrückt sind.
  • Im Übrigen kann als Quellentrenner ein herkömmlicher Quellentrenner verwendet werden, der an seinen Ausgängen einkanalige Repräsentationen der Audioinhalte der verschiedenen Signalquellen liefert, wobei der herkömmliche Quellentrenner lediglich für eine Begrenzung oder Minimierung einer Verzerrung zwischen seinem ersten Eingang (für das erste Mikrophonsignal) und seinem ersten Ausgang (für das erste Teilsignal) sowie für eine Begrenzung oder Minimierung einer Verzerrung zwischen seinem zweiten Eingang (für das zweite Mikrophonsignal) und seinem zweiten Ausgang (für das zweite Teilsignal) ausgelegt sein muss.
  • Ferner bietet der erfindungsgemäße Signaltrenner den Vorteil, dass Rest-Anteile der Stör-Signalquellen hinsichtlich ihrer räumlichen Lage gegenüber den Eingangssignalen bzw. Mikrofonsignalen nicht verändert werden, dass also Restsignale von den Störsignalquellen auf dem ursprünglichen bzw. tatsächlichen Ort der Störsignalquellen abgebildet werden.
  • Bei einem bevorzugten Ausführungsbeispiel ist der Quellentrenner ausgelegt, um die Audioinhalte der zumindest zwei Signalquellen (also der Nutz-Signalquelle und der Stör-Signalquelle) aufgrund deren räumlichen Lage in dem Raum oder aufgrund deren statistischen Eigenschaften zu trennen. Eine Trennung der Signalquellen aufgrund deren Korrelationseigenschaften ist besonders vorteilhaft, da in diesem Fall die Signaltrennung blind bzw. ohne irgendeine Vorkenntnis über die räumliche Lage der Signalquellen bzw. über eine Schallausbreitung in dem Raum erfolgt. Somit benötigt der Quellentrenner nur ein minimales Maß an Vorab- Informationen, nämlich Information über die Korrelationseigenschaften bzw. die Signalstatistik der von den Signalquellen erzeugten Signale.
  • Bei einem weiteren Ausführungsbeispiel ist der Quellentrenner ausgelegt, um die Parameter der Verarbeitungsvorschrift zur Erzeugung des ersten Teilsignals in Abhängigkeit von einem Maß für die Verzerrung des ersten Teilsignals gegenüber dem ersten Mikrophonsignal zu bestimmen, und um die Verzerrung des ersten Teilsignals gegenüber dem ersten Mikrophonsignal nach oben zu begrenzen. In anderen Worten, die Parameter der Verarbeitungsvorschrift für die Bestimmung. des ersten Teilsignals und des zweiten Teilsignals werden derart bestimmt, dass die Verzerrung nach oben hin begrenzt ist. Dies kann beispielsweise durch die Vorgabe eines vorgegebenen Werteraums für die Parameter der Verarbeitungsvorschrift erfolgen, wobei der Werteraum so gewählt ist, dass die Verzerrung kleiner als eine maximale Verzerrung ist. Beispielsweise kann vorgegeben sein, dass das erste Teilsignal sich von dem ersten Mikrophonsignal gemäß einer vorbestimmten Norm (beispielsweise in einem quadratischen Mittel) um weniger als eine vorgegebene maximale Abweichung unterscheidet.
  • Bei einem Ausführungsbeispiel ist der Quellentrenner ausgelegt, um die Parameter der Verarbeitungsvorschrift derart zu verändern, dass eine Verzerrung zwischen dem ersten Mikrophonsignal und dem ersten Teilsignal verringert wird, falls festgestellt wird, dass die Verzerrung größer als ein vorgegebener Schwellwert ist. Alternativ oder zusätzlich kann ferner der Quellentrenner ausgelegt sein, um ein Maß für die Verzerrung des ersten Teilsignals gegenüber dem ersten Mikrophonsignal (bzw. des zweiten Teilsignals gegenüber dem zweiten Mikrophonsignal) bei einer Einstellung oder Optimierung der Parameter der Verarbeitungsvorschrift zu berücksichtigen (vergleiche beispielsweise [14]).
  • Durch die genannte Maßnahme wird erzielt, dass insgesamt die Verzerrung zwischen dem ersten Mikrophonsignal und dem ersten Teilsignal (bzw. zwischen dem zweiten Mikrophonsignäl und dem zweiten Teilsignal) nach oben hin begrenzt oder minimiert wird.
  • Bei einem weiteren bevorzugten Ausführungsbeispiel ist der Quellentrenner ausgelegt, um die Parameter der Verarbeitungsvorschrift (bzw. der Verarbeitungsvorschriften) zur Erzeugung des ersten Teilsignals und des zweiten Teilsignals durch eine Optimierung unter Verwendung einer Kostenfunktion zu ermitteln. Durch die genannte Optimierung kann ein bestmöglichstes Ergebnis erzielt werden, das eine Balance zwischen der Trennung der Signalquellen (statistische Unabhängigkeit zwischen den Teilsignalen) und der Verzerrung aufweist.
  • Gemäß einem weiteren alternativen Ausführungsbeispiel umfasst die vorliegende Erfindung einen Signaltrenner gemäß Anspruch 12.
  • Der Signaltrenner gemäß Anspruch 10 basiert auf dem Kerngedanken, dass es vorteilhaft ist, mit einem Quellentrenner ein Störsignal von einer Störsignalquelle aus zumindest zwei Mikrophonsignalen zu extrahieren, das dadurch entstehende Teilsignal mit einem einstellbaren Filter zumindest zweimal in verschiedener Weise zu verzerren, das erste verzerrte Teilsignal aus dem ersten Mikrophonsignal zu entfernen und das zweite verzerrte Teilsignal aus dem zweiten Mikrophonsignal zu entfernen. Somit entsteht ein erstes bereinigtes Mikrophonsignal, das das erste Ausgangsignal bildet, sowie ein zweites bereinigtes Mikrophonsignal, das das zweite Ausgangssignal bildet. Ein Parametereinsteller ist ferner ausgelegt, um die Filterparameter bei der Erzeugung des ersten verzerrten Teilsignals und die Filterparameter bei der Erzeugung des zweiten verzerrten Signals unabhängig voneinander einzustellen, so dass aus dem ersten Mikrophonsignal und aus dem zweiten Mikrophon signal verschiedenartig verzerrte Versionen des Störsignals der Störsignalquelle entfernt werden. Der Parametereinsteller ist also ausgelegt, um die Parameter für die Erzeugung des ersten verzerrten Teilsignals und des zweiten verzerrten Teilsignals unabhängig voneinander einzustellen, so dass eine unabhängige Minimierung bzw. Reduzierung des Audioinhalts der Störsignalquelle in den beiden Mikrophonsignalen erfolgt. Dies ist vorteilhaft, da sich der Beitrag der Störsignalquelle in dem ersten Mikrophonsignal von dem Beitrag der Störsignalquelle in dem zweiten Mikrophonsignal unterscheidet, da ja verschiedene Ausbreitungswege zwischen der Störsignalquelle und dem Schallaufnehmern zur Erzeugung der Mikrophonsignale liegen.
  • Ferner wird durch die adaptive Verzerrung des Teilsignals, die bevorzugt so erfolgt, dass beispielsweise in dem ersten bereinigten Mikrophonsignal an dem Ausgang des Signalentferners ein Audioinhalt der Störsignalquelle reduziert ist, sichergestellt, dass in dem ersten verzerrten Teilsignal die Störsignalquelle auf die gleiche räumliche Position abgebildet ist wie dies durch das erste Mikrophonsignal beschrieben wird. Die Kombination des ersten verzerrten Teilsignals und des ersten Mikrophonsignals führt somit dazu, dass ein Rest-Anteil des Audioinhalts der Störsignalquelle auf die tatsächlich räumliche Position der Störsignalquelle abgebildet wird.
  • Analog dazu wird aufgrund der genannten Vorgehensweise der Restanteil der Störsignalquelle in dem zweiten Ausgangssignal auf die tatsächliche Position der Störsignalquelle abgebildet. Somit ist die Position der Störsignalquelle in den beiden Ausgangssignalen korrekt dargestellt, sofern in den Ausgangssignalen Restanteile der Störsignalquelle vorliegen.
  • Ferner sei darauf hingewiesen, dass die beiden Ausgangssignale im Wesentlichen direkt auf den beiden Eingangssignalen bzw. Mikrophonsignalen basieren, wobei lediglich Signalan teile der Störsignalquellen aus den Eingangssignalen bzw. Mikrophonsignalen entfernt sind. Daher geben die beiden Ausgangssignale auch die räumliche Position der Nutz-Signalquelle korrekt wieder.
  • Ein weiterer Vorteil des erfindungsgemäßen Signaltrenners besteht darin, dass der Quellentrenner lediglich in der Lage sein muss, das Signal der Störsignalsquelle aus den beiden Mikrophonsignalen zu extrahieren. Der Quellentrenner muss daher lediglich ein einkanaliges Ausgangssignal liefern, das den Audioinhalt der Stör-Signalquelle wiedergibt. Eine etwaige in dem Quellentrenner auftretende Verzerrung des Teilsignals gegenüber dem Mikrophonsignal wird durch das einstellbare Filter ausgeglichen, wobei das einstellbare Filter das Teilsignal auf zweierlei unabhängig voneinander einstellbare Weise verzerrt, um somit der Tatsache gerecht zu werden, dass aus den beiden Mikrophonsignalen verschiedenartig verzerrte Versionen des Störsignals der Störquelle entfernt werden müssen.
  • Bei einem weiteren bevorzugten Ausführungsbeispiel ist der Parametereinsteller ausgelegt, um die Leistung in dem ersten bereinigten Mikrophonsignal und die Leistung in dem zweiten bereinigten Mikrophonsignal zu bestimmen, um die Filterparameter des ersten einstellbaren Filters so zu verändern, dass eine Leistung in dem ersten bereinigten Mikrophonsignal verringert wird, und um die Filterparameter des zweiten einstellbaren Filters so zu verändern, dass die Leistung in dem zweiten bereinigten Mikrophonsignal verringert wird. Es hat sich nämlich gezeigt, dass die Leistung in dem ersten bereinigten Mikrophonsignal und die Leistung in dem zweiten bereinigten Mikrophonsignal einfach verwendbare Kriterien dafür sind, ob die Verzerrung des Teilsignals durch das einstellbare Filter bei der Erzeugung des ersten verzerrten Teilsignals und des zweiten verzerrten Teilsignals korrekt eingestellt ist. Da nämlich in dem ersten verzerrten Teilsignal und dem zweiten verzerrten Teilsignal im Wesentlichen nur ein Signalanteil von der Störsignalquelle enthalten ist, wird eine Leistung des ersten bereinigten Mikrophonsignals beispielsweise minimal, wenn das einstellbare Filter so eingestellt ist, dass der Audioinhalt von der Störsignalquelle in dem ersten bereinigten Mikrophonsignal minimiert ist. Der genannte Sachverhalt kann im übrigen in besonders effizienter Weise in Zeitintervallen ausgenutzt werden, während derer das Signal der Nutz-Signalquelle sehr schwach ist, da dann in den Mikrofonsignalen das Signal von der Stör-Signalquelle dominiert. Eine analoge Aussage gilt auch für die optimale Einstellung der Filterparameter für die Erzeugung des zweiten verzerrten Teilsignals.
  • Es sei hierbei darauf hingewiesen, dass unter dem Signal beispielsweise auch ein Block bzw. ein zeitlicher Ausschnitt betrachtet wird, dem beispielsweise eine Energie oder eine (mittlere) Leistung zuordenbar ist.
  • Bei einem weiteren bevorzugten Ausführungsbeispiel umfasst der Parametereinsteller einen Nutzsignal-Erkenner, der ausgelegt ist, um zu erkennen, wenn ein Nutzsignal von einer Nutzsignalquelle mit zumindest einer minimalen Nutzsignalstärke in dem erste Mikrophonsignal und/oder in dem zweiten Mikrophonsignal vorliegt. Der Parametereinsteller ist ferner ausgelegt, um die Filterparameter nur dann zu verändern, wenn kein Nutzsignal mit zumindest der minimalen Nutzsignalstärke vorliegt. Es wurde nämlich erkannt, dass eine Einstellung der Filterparameter dann in einer optimalen Weise durch Minimierung der Leistung der bereinigten Mikrophonsignale erfolgen kann. Liegt nämlich kein oder nur ein sehr geringes Nutzsignal vor, so wird die Leistung der bereinigten Mikrophonsignale zu Null oder zumindest sehr klein, wenn die Filterparameter des einstellbaren Filters so eingestellt sind, dass eine optimale Verringerung des Audioinhalts der Störsignalquelle in den bereinigten Mikrophonsignalen vorliegt.
  • Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Figuren näher erläutert. Es zeigen:
  • 1 ein Blockschaltbild eines erfindungsgemäßen Signaltrenners unter Verwendung eines Quellentrenners mit einer Nebenbedingung, gemäß einem ersten Ausführungsbeispiels der vorliegenden Erfindung;
  • 2 ein Blockschaltbild eines erfindungsgemäßen Signaltrenners unter Verwendung eines Quellentrenners mit einer Nebenbedingung, gemäß einem zweiten Ausführungsbeispiel der vorliegenden Erfindung;
  • 3 ein Blockschaltbild eines erfindungsgemäßen Signaltrenners unter Verwendung eines einstellbaren Filters, das das von dem Quellentrenner gelieferte Teilsignal filtert, gemäß einem dritten Ausführungsbeispiel der vorliegenden Erfindung;
  • 4 ein Blockschaltbild eines umkonfigurierbaren erfindungsgemäßen Signaltrenners, gemäß einem vierten Ausführungsbeispiel der vorliegenden Erfindung;
  • 5 ein Blockschaltbild eines Quellentrenners zum Einsatz in einem erfindungsgemäßen Signaltrenner;
  • 6 ein Signalflussplan für ein erfindungsgemäßen Signaltrenner unter Verwendung von Signalen im Frequenzbereich;
  • 7 ein Blockschaltbild eines erfindungsgemäßen Signaltrenners zum Entfernen von zwei oder mehr Störsignalen aus zumindest zwei Mikrophonsigna len, gemäß einem fünften Ausführungsbeispiel der vorliegenden Erfindung;
  • 8 ein Flussdiagramm eines ersten erfindungsgemäßen Verfahrens gemäß einem sechsten Ausführungsbeispiel der vorliegenden Erfindung; und
  • 9 ein Flussdiagramm eines zweiten erfindungsgemäßen Verfahrens gemäß einem siebten Ausführungsbeispiel der vorliegenden Erfindung.
  • 1 zeigt ein Blockschaltbild eines erfindungsgemäßen Signaltrenners unter Verwendung eines Quellentrenners mit einer Nebenbedingung, gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung. Die Anordnung gemäß der 1 ist in ihrer Gesamtheit mit 100 bezeichnet. Der Signaltrenner 100 empfängt zwei Mikrophonsignale x1, x2 von zwei Mikrophonen bzw. Schallaufnehmern 110, 112. Die Mikrophone bzw. Signalaufnehmer 110, 112 nehmen akustische Signale von zumindest zwei Signalquellen 120, 122 auf, wobei eine erste Signalquelle 120 im Folgenden als Nutz-Signalquelle bezeichnet wird, und wobei eine zweite Signalquelle 122 im Folgenden als Stör-Signalquelle bezeichnet wird. Typischerweise ist die Nutzsignalquelle 120 sowohl durch den ersten Schallaufnehmer 110 als auch durch den zweiten Schallaufnehmer 112 wahrnehmbar. Ebenso ist typischerweise die Störsignalquelle sowohl durch den ersten Schallaufnehmer 110 als auch durch den zweiten Schallaufnehmer 112 wahrnehmbar. Somit umfasst das erste Mikrophonsignal x1 typischerweise Signalanteile sowohl von der Nutzsignalquelle 120 als auch von der Störsignalquelle 122. Ebenso umfasst auch das zweite Mikrophonsignal x2 typischerweise Signalanteile sowohl von der Nutzsignalquelle 120 als auch von der Störsignalquelle 122.
  • Es sei hierbei darauf hingewiesen, dass die Mikrophonsignale x1 und x2 nicht direkt bzw. unmittelbarer durch Mikrophone bzw. Schallaufnehmer 110, 112 erzeugt sein müssen, sondern dass beispielsweise die Mikrophonsignale x1 und x2 auch durch eine Übertragung von Audiosignalen (beispielsweise über eine analoge oder digitale Datenverbindung) gebildet sein können. Ferner können die Mikrophonsignale x1, x2 auch von einem Audio-Wiedergabegerät oder von einem Computer stammen.
  • Ein blinder Quellentrenner 130 empfängt die beiden Mikrophonsignale x1, x2, und erzeugt basierend auf den Mikrophonsignalen x1, x2 zwei Teilsignale y1, y2. Dabei umfasst das erste Teilsignal y1 im Wesentlichen einen Audioinhalt der Nutzsignalquelle 120, während hingegen das zweite Teilsignal y2 im Wesentlichen einen Audioinhalt der Störsignalquelle 122 umfasst. Das erste Teilsignal y1 bildet ein erstes Ausgangssignal a1. Eine optionale Verzögerungseinrichtung 136 verzögert das zweite Mikrophonsignal x2 und liefert daher ein verzögertes zweites Mikrophonsignal x2'. Ein Differenzbilder 140 empfängt das verzögerte zweite Mikrophonsignal x2', und ist ausgelegt, um das zweite Teilsignal y2 von dem verzögerten zweiten Mikrophonsignal x2' abzuziehen. Der Differenzbilder 140 bildet somit ein zweites Ausgangssignal a2 als Differenz zwischen dem verzögerten zweiten Mikrophonsignal x2' und dem zweiten Teilsignal y2.
  • Für den Fall, dass die Verzögerungseinrichtung 136 entfällt, ist im Übrigen das verzögerte zweite Mikrophonsignal x2' identisch zu dem zweiten Mikrophonsignal x2.
  • Basierend auf der strukturellen Beschreibung des erfindungsgemäßen Signaltrenners 100 wird im Folgenden die Funktion desselben erläutert.
  • Der blinde Quellentrenner 130 ist ausgelegt, um eine blinde Quellentrennung unter Verwendung einer Nebenbedingung durchzuführen. Der blinde Quellentrenner liefert das erste Teilsignal y1, das im Wesentlichen den Audioinhalt der ersten Signalquelle bzw. Nutzsignalquelle 120 umfasst, und in dem ein Audioinhalt der zweiten Signalquelle bzw. Störsignalquelle 122 um mindestens 3 dB, bevorzugt aber um mindestens 6 dB (besser aber um mindestens 10 dB, oder um mindestens 20 dB) schwächer ist als der Audioinhalt der ersten Signalquelle bzw. Nutzsignalquelle 120. Ferner ist der blinde Quellentrenner 130 ausgelegt, um das zweite Teilsignal y2 derart zu erzeugen, dass das zweite Teilsignal im Wesentlichen den Audioinhalt der zweiten Signalquelle bzw. Störsignalquelle 122 umfasst, dass also beispielsweise der Audioinhalt der ersten Signalquelle 120 in dem zweiten Teilsignal y2 um mindestens 3 dB, bevorzugt aber um mindestens 6 dB (besser noch um mindestens 10 dB oder um mindestens 20 dB) schwächer ist als der Audioinhalt der Stör-Signalquelle. Der blinde Quellentrenner 130 liefert somit als die zwei Teilsignale y1, y2 zwei Signale, die die Rudioinhalte der ersten Signalquelle 120 und der zweiten Signalquelle 122 im Wesentlichen voneinander getrennt als einkanalige Signale enthalten.
  • Der blinde Quellentrenner 130 ist ferner ausgelegt, um sicherzustellen, dass eine Verzerrung zwischen dem ersten Teilsignal y1 und dem ersten Mikrophonsignal x1 kleiner als eine Maximalverzerrung ist, wobei die Maximalverzerrung typischerweise vorgegeben ist. Die Maximalverzerrung kann beispielsweise durch eine mittlere quadratische Abweichung zwischen dem ersten Teilsignal y1 und dem ersten Mikrophonsignal x1 definiert sein. Das Maß für die Abweichung zwischen dem ersten Teilsignal y1 und dem ersten Mikrophonsignal x1 kann im Übrigen beispielsweise auch auf eine Leistung in dem ersten Mikrophonsignal x1 und/oder auf eine Leistung in dem ersten Teilsignal y1 bezogen sein.
  • Optional kann der blinde Quellentrenner 130 ferner ausgelegt sein, um sicherzustellen, dass eine Verzerrung zwischen dem zweiten Teilsignal y2 und dem zweiten Mikrophonsignal x2 kleiner als eine Maximalverzerrung ist, wobei die Maximalverzerrung typischerweise vorgegeben ist. Die Maximalverzerrung des zweiten Teilsignals y2 gegenüber dem zweiten Mikrophonsignal x2 kann beispielsweise gleich der Maximalverzerrung des ersten Teilsignals y1 gegenüber dem ersten Mikrophonsignal sein, oder sich davon unterscheiden. Bei einem bevorzugten Ausführungsbeispiel ist der blinde Quellentrenner 130 ausgelegt, um sowohl die Verzerrung des ersten Teilsignals y1 gegenüber dem ersten Mikrophonsignal x1 als auch die Verzerrung des zweiten Teilsignals y2 gegenüber dem zweiten Mikrophonsignal x2 nach oben hin zu begrenzen.
  • Der blinde Quellentrenner 130 kann ferner ausgelegt sein, um eine Verzerrung des ersten Teilsignals y1 gegenüber dem ersten Mikrophonsignal x1 (sowie optional zusätzlich eine Verzerrung des zweiten Teilsignals y2 gegenüber dem zweiten Mikrophonsignal x2) zu minimieren, oder um zumindest ein Kriterium, das die Größe der Verzerrung beschreibt, bei der Einstellung der Parameter zu berücksichtigen. Details im Hinblick auf eine Implementierung eines blinden Quellentrenners mit einer Nebenbedingung, der eine Optimierung oder Minimierung einer Verzerrung ermöglicht, sind beispielsweise in der Veröffentlichung [14] von K. Matsuoka und S. Nakashima beschrieben.
  • Durch den blinden Quellentrenner 130 mit der genannten Nebenbedingung, die zu einer Begrenzung (oder Optimierung oder Minimierung) der Verzerrung führt, ist somit gewährleistet, dass das erste Teilsignal y1 im Wesentlichen den Audioinhalt der ersten Signalquelle 120 umfasst, und ferner gegenüber dem ersten Mikrophonsignal x1 nicht zu stark verzerrt ist.
  • Der blinde Quellentrenner 130 ist also derart ausgelegt, dass das erste Teilsignal y1 im Wesentlichen den von der ersten Signalquelle 120 stammenden Anteil des ersten Mikrophonsignals x1 umfasst. Signalanteile der zweiten Signalquelle 122 sind hingegen in dem ersten Teilsignal y1 reduziert bzw. unterdrückt. Damit stellt das Ausgangssignal a1, das im Wesentlichen gleich dem ersten Teilsignal y1 ist, den in dem Mikrophonsignal x1 enthaltenden Anteil der ersten Signalquelle dar, und ist ferner gegenüber dem ersten Mikrophonsignal x1 nur geringfügig (innerhalb des durch die Nebenbedingung des blinden Signaltrenners 130 festgelegten Rahmens) verzerrt. In anderen Worten, eine Phasenverschiebung zwischen dem ersten Ausgangssignal a1 und dem ersten Mikrophonsignal x1 ist im Wesentlichen unabhängig von der Einstellung des blinden Quellentrenners 130. In anderen Worten, eine Phasenverschiebung zwischen dem ersten Ausgangssignal a1 und dem ersten Mikrophonsignal x1 ist im Wesentlichen vorbestimmt bzw. eine Phasenverschiebung zwischen dem ersten Ausgangssignal a1 und dem ersten Mikrophonsignal x1 schwankt bevorzugt um nicht mehr als +/– 20° (besser aber um nicht mehr als +/– 10°, oder +/– 5°), wenn die Einstellung des blinden Quellentrenners 130 verändert wird. In ähnlicher Weise ist der blinde Quellentrenner 130 mit Nebenbedingung so ausgelegt, dass eine Phasenverschiebung zwischen dem zweiten Teilsignal y2 und dem zweiten Mikrophonsignal x2 um weniger als +/– 20° (besser aber um weniger als +/– 10°, oder um weniger als +/– 5°) variiert, wenn die Einstellung des blinden Quellentrenners 130 verändert wird.
  • Durch die entsprechende Ausgestaltung des blinden Quellentrenners 130 (basierend auf der Nebenbedingung) ist gewährleistet, dass in dem ersten Ausgangssignal a1, das auf dem ersten Teilsignal y1 basiert bzw. das identisch zu dem ersten Teilsignal y1 ist, die erste Signalquelle 120 ortsrichtig dargestellt ist. Ferner ist sichergestellt, dass in dem zweiten Teilsignal y2 der Audioinhalt der zweiten Signalquelle 122 im Wesentlichen unverzerrt gegenüber dem zweiten Mikrophonsignal x2 enthalten ist, so dass der Audioinhalt der zweiten Signalquelle 122 durch den Differenzbilder 140 aus dem zweiten Mikrophonsignal x2 bzw. aus dem verzögerten zweiten Mikrophonsignal x2' entfernt werden kann. Da das zweite Ausgangssignal a2 im Wesentlichen auf dem zweiten Mikrophonsignal x2 basiert, und gegenüber dem zweiten Mikrofonsignal lediglich durch eine Verzö gerung und eine Entfernung des zweiten Teilsignals y2 verändert ist, ist die räumliche Lage der ersten Signalquelle 120 in dem zweiten Ausgangssignal a2 korrekt dargestellt. Ferner wird durch die Anordnung 100 erreicht, dass in den Ausgangssignalen a1, a2 auch die räumliche Lage der zweiten Signalquelle 122 bzw. des durch die zweite Signalquelle 122 verursachten Rest-Anteils korrekt dargestellt ist.
  • Es sei im Übrigen darauf hingewiesen, dass die Anordnung 100 einen optionalen Selektor 150 umfasst. Der Selektor 150 hat in dem gezeigten Ausführungsbeispiel jedoch lediglich die Aufgabe, das erste Teilsignal y1 dem ersten Ausgang als das erste Ausgangssignal a1 zuzuführen, und das zweite Teilsignal y2 dem Differenzbilder 140 zuzuführen. Ein anderer Schaltzustand des Selektors 150 ist allerdings in der 2 gezeigt.
  • 2 zeigt ein Blockschaltbild eines erfindungsgemäßen Signaltrenners gemäß einem zweiten Ausführungsbeispiel der vorliegenden Erfindung. Der Signaltrenner gemäß der 2 ist in seiner Gesamtheit mit 200 bezeichnet. Da der Signaltrenner 200 gemäß der 2. dem Signaltrenner 100 gemäß der 1 sehr ähnlich ist, sind gleiche Merkmale bzw. Signale in den 1 und 2 gleich bezeichnet und werden hier nicht noch einmal erläutert.
  • Die Anordnung 200 gemäß der 2 unterscheidet sich von der Anordnung 100 gemäß der 1 im Wesentlichen dadurch, dass im Hinblick auf die Anordnung 200 davon ausgegangen wird, dass die zweite Signalquelle 122 das Nutzsignal liefert, während die erste Signalquelle 120 das Störsignal liefert. Ferner wird davon ausgegangen, dass das zweite Teilsignal y2 im Wesentlichen den Audioinhalt der zweiten Signalquelle 122 umfasst, während das erste Teilsignal y1 im Wesentlichen den Audioinhalt der ersten Signalquelle 120 umfasst. Aus diesem Grund stellt das zweite Teilsignal y2 ein Ausgangssignal dar, das den durch die zweite Signal quelle 122 gelieferten Signalanteil in dem zweiten Mikrophonsignal x2 beschreibt. Aus diesem Grund ist der Selektor 150 bei der Anordnung 200 konfiguriert, um das zweite Teilsignal y2 an dem zweiten Signalausgang als das zweite Ausgangssignal a2 bereitzustellen. Der Differenzbilder 140 empfängt hingegen das erste Teilsignal y1, das im Wesentlichen das Störsignal von der Störsignalquelle 120 umfasst. Der Differenzbilder 140 empfängt ferner das erste Mikrophonsignal x1 bzw. das durch die optionale Verzögerungseinrichtung 136 verzögerte erste Mikrophonsignal x1'. Das Ausgangssignal des Differenzbilders 140 bildet somit das erste Ausgangssignal a1 und wird (beispielsweise über einen weiteren Selektor) zu dem ersten Ausgang weitergeleitet.
  • Zusammenfassend ist festzuhalten, das im Rahmen einer blinden Quellentrennung nicht von vorneherein festgelegt ist, an welchem Ausgang eines Quellentrenners das Nutzsignal anliegt und an welchem Ausgang des Quellentrenners das Störsignal anliegt. Daher wird bevorzugt durch einen Selektor ausgewählt, welcher der Ausgänge des Quellentrenners das Nutzsignal trägt und damit direkt mit einem Ausgang des Signaltrenners gekoppelt wird, und welcher der Ausgänge des Quellentrenners das Störsignal trägt und damit mit einer Störsignal-Entfernungseinrichtung gekoppelt wird.
  • Die Auswahl durch den Selektor erfolgt beispielsweise (aber nicht notwendigerweise) aufgrund einer räumlichen Information über die Position der Quellen, wie beispielsweise in [10] beschrieben.
  • Bei einem ersten Ausführungsbeispiel gemäß 1 trägt ein erstes Ausgangsignal y1 des Quellentrenners (bzw. Quellentrenner-Kerns) das Nutzsignal, während ein zweites Ausgangssignal y2 des Quellentrenners (bzw. Quellentrenner-Kerns) das Störsignal trägt. Somit bildet in diesem Fall das erste Ausgangssignal y1 das erste Teilsignal z1, während das zweite Ausgangssignal y2 das zweite Teilsignal z2 bildet.
  • Bei einem zweiten Ausführungsbeispiel gemäß 1 trägt ein erstes Ausgangsignal y1 des Quellentrenners (bzw. Quellentrenner-Kerns) das Störsignal, während ein zweites Ausgangssignal y2 des Quellentrenners (bzw. Quellentrenner-Kerns) das Nutzsignal trägt. Somit bildet in diesem Fall das erste Ausgangssignal y1 das zweite Teilsignal z2, während das zweite Ausgangssignal y2 das erste Teilsignal z1 bildet.
  • Ganz allgemein ist somit festzuhalten, dass bevorzugt das die Verzerrung des zweiten Teilsignals (bzw. des Störsignals) gegenüber dem Mikrofonsignal, aus dem das Störsignal entfernt wird, begrenzt ist (z.B. durch die Nebenbedingung). Hingegen ist bevorzugt die Verzerrung des ersten Teilsignals (bzw. des Nutzsignals) gegenüber dem Mikrofonsignal, an dessen Stelle das erste Teilsignal tritt, begrenzt.
  • 3 zeigt ein Blockschaltbild eines erfindungsgemäßen Quellentrenners unter Verwendung eines einstellbaren Filters, gemäß einem dritten Ausführungsbeispiel der vorliegenden Erfindung. Die Anordnung gemäß der 3 ist in ihrer Gesamtheit mit 300 bezeichnet. Die Anordnung 300 umfasst zwei Mikrophone bzw. Schallaufnehmer 310, 312, wobei der erste Schallaufnehmer 310 ein erstes Mikrophonsignal x1 liefert, und wobei der zweite Schallaufnehmer 312 ein zweites Mikrophonsignal x2 liefert. Wie schon oben erläutert, können die Mikrophonsignale jedoch auch von anderen Quellen, beispielsweise von einer Signalübertragungseinrichtung, einer Audiosignalwiedergabeeinrichtung oder einem Computer stammen.
  • Die 3 zeigt ferner eine erste Signalquelle 320 sowie eine zweite Signalquelle 322, die beide akustische Signale abgeben, die sich in den Mikrophonsignalen x1, x2 wiederspiegeln. Im Hinblick auf 3 wird im Folgenden angenommen, dass die Signalquelle 320 eine Nutzsignalquelle bil det, und dass die zweite Signalquelle 322 eine Störsignalquelle bildet. Die Anordnung 300 umfasst einen blinden Quellentrenner (BSS) 330. Der blinde Quellentrenner 330 empfängt das erste Mikrophonsignal x1 und das zweite Mikrophonsignal x2, und ist ferner ausgelegt, um ein Teilsignal y2 aus dem ersten Mikrophonsignal und dem zweiten Mikrophonsignal x1, x2 zu extrahieren. Die Anordnung 300 umfasst ferner zwei einstellbare Filter 340, 350, die als zu filterndes Eingangssignal beide das Teilsignal y2 empfangen. Das erste einstellbare Filter 340 erzeugt basierend auf dem Teilsignal y2 ein erstes verzerrtes Teilsignal y2'. Das zweite einstellbare Filter 350 erzeugt basierend auf dem Teilsignal y2 ein zweites verzerrtes Teilsignal y2''. Die Anordnung 300 umfasst weiterhin einen ersten Differenzbilder 360 sowie eine zweiten Differenzbilder 370. Der erste Differenzbilder 360 empfängt das erste Mikrophonsignal x1 oder ein auf dem ersten Mikrophonsignal x1 basierendes Signal x1'. Das auf dem ersten Mikrophonsignal x1' basierende Signal geht beispielsweise durch eine optionale Allpassfilterung in einem Filter 380 aus dem ersten Mikrophonsignal hervor. Alternativ dazu kann das Signal x1' aber auch identisch zu dem ersten Mikrophonsignal x1 sein. Der Differenzbilder 360 subtrahiert somit das erste verzerrte Teilsignal y2' von dem Signal x1', um ein erstes Ausgangssignal e1 (auch mit a1 bezeichnet) zu erhalten. Der zweite Differenzbilder 370 empfängt ferner ein auf dem zweiten Mikrophonsignal x2 basierendes Signal x2', wobei das Signal x2' beispielsweise durch eine (optionale) Allpassfilterung in einem Filter 382 aus dem zweiten Mikrophonsignal x2 abgeleitet ist. Das Signal x2' kann aber auch identisch zu dem zweiten Mikrophonsignal x2 sein.
  • Der zweite Differenzbilder 370 subtrahiert von dem Signal x2' (oder von dem zweiten Mikrophonsignal x2) das zweite verzerrte Teilsignal y2'', um als Ergebnis ein zweites Ausgangssignal e2 (auch als a2 bezeichnet) zu erhalten.
  • Ein zu dem ersten einstellbaren Filter 340 gehöriger Parametereinsteller 386 (auch als Adaptionssteuerung bezeichnet) empfängt das erste Ausgangssignal e1, und ist ausgelegt, um die Parameter der stattfindenden Filterung in Abhängigkeit von dem ersten Ausgangssignal e1 einzustellen. In anderen Worten, das erste Ausgangssignal e1 bildet ein Fehlersignal für das erste einstellbare Filter 340. In ähnlicher Weise empfängt ein zu dem zweiten einstellbaren Filter 340 gehöriger Parametereinsteller 388 (auch als Adaptionssteuerung bezeichnet) das zweite Ausgangssignal e2 für eine Einstellung der Filterparameter. Das zweite Ausgangssignal e2 dient somit als ein Fehlersignal für das zweite einstellbare Filter 350. Bei den einstellbaren Filtern 340, 350 handelt es sich bevorzugt um adaptive Filter, deren Filterparameter basierend auf den zugehörigen Fehlersignalen durch die zugehörigen Parametereinsteller bzw. Adaptionssteuerungen 386, 388 eingestellt werden.
  • Es sei hier darauf hingewiesen, dass das erste einstellbare Filter 340 und das zweite einstellbare Filter 350 auch als ein einziges Filter realisiert werden können, das unabhängig voneinander das erste verzerrte Teilsignal y2' und das zweite verzerrte Teilsignal y2'' aus dem Teilsignal y2 erzeugt. Auch in diesem Fall dient das erste Ausgangssignal e1 dazu, die Filterparameter einzustellen, die bei der Erzeugung des ersten verzerrten Teilsignals y2' aus dem Teilsignal y2 angewendet werden. Das zweite Ausgangssignal e2 dient einer Einstellung der Filterparameter, die bei der Erzeugung des zweiten verzerrten Teilsignals y2'' aus dem Teilsignal y2 angewendet werden.
  • Bei den Filtern 340, 350 handelt es sich somit um adaptive Filter, deren Filtercharakteristik durch die Parametereinsteller bzw. Adaptionssteuerungen 386, 388 in Abhängigkeit von den zugehörigen Ausgangssignalen e1, e2, eingestellt werden, wobei das erste Ausgangssignal e1 die Differenz zwischen dem ersten Mikrophonsignal x1 (oder dem darauf basierenden verzögerten und/oder Allpass-gefilterten Signal x1') und dem ersten verzerrten Teilsignal y2' dar stellt, und wobei das zweite Ausgangssignal e2 die Differenz zwischen dem zweiten Mikrophonsignal x2 (bzw. dem davon durch eine Verzögerung und/oder Allpass-Filterung abgeleiteten Signal x2') und dem zweiten verzerrten Teilsignal y2'' darstellt.
  • Ganz. allgemein kann das erste Filter 340 in Verbindung mit dem Parametereinsteller 386 somit auch als ein adaptives Filter angesehen werden, das ausgelegt ist, um die Filterparameter so einzustellen, dass das erste verzerrte Teilsignal y2' mit dem ersten Mikrophonsignal x1 bzw. dem davon abgeleiteten Signal x1' (so gut wie möglich) übereinstimmt. In anderen Worten, das erste Mikrophonsignal x1 bzw. das davon abgeleitete Signal x1' dient als Referenzsignal für die Einstellungen der Filterparameter des ersten einstellbaren Filters 340. In ähnlicher Weise dient das zweite Mikrophonsignal x2 bzw. das davon abgeleitete Signal x2' als Referenzsignal für die Einstellung der Filterparameter des zweiten einstellbaren Filters 350, um das zweite Filter bevorzugt so einzustellen, dass das zweite verzerrte Teilsignal (so gut wie möglich) mit dem zweiten Mikrophonsignal x2 bzw. dem davon abgeleiteten Signal x2' übereinstimmt.
  • Es sei darauf hingewiesen, dass die Einstellung der Filterkoeffizienten der einstellbaren Filter 340 oder 350 bevorzugt dann erfolgt, wenn in den Mikrophonsignalen x1, x2 bzw. in den davon abgeleiteten Signalen x1', x2' im Wesentlichen nur ein Anteil der Störsignalquelle 322 enthalten ist. In diesem Fall können die Parameter der Filter 340, 350 basierend auf den Ausgangssignalen e1, e2 so eingestellt werden, dass das erste verzerrte Teilsignal y2' im Wesentlichen dem durch die Störsignalquelle 322 verursachten Anteil in dem Mikrophonsignal x1 bzw. in dem Signal x1' entspricht, und dass das zweite verzerrte Teilsignal y2'' im Wesentlichen dem in dem zweiten Mikrophonsignal x2 bzw. in dem Signal x2' enthaltenen Anteil der Störsignalquelle 322 entspricht. Unter den genannten Voraussetzungen wird ein durch die Störsignalquelle 322 verursachter Anteil in dem ersten Ausgangssignal e1 und in dem zweiten Ausgangssignal e2 wirksam reduziert bzw. unter Umständen sogar minimiert (beispielsweise im Hinblick auf eine Leistung bzw. Energie).
  • Die Einstellung bzw. Adaption der Filterparameter des ersten einstellbaren Filters 340 und des zweiten einstellbaren Filters 350 erfolgt also bevorzugt dann, wenn in den Mikrophonsignalen x1, x2 im Wesentlichen nur ein Anteil von der Störsignalquelle 322 enthalten ist, wenn in den Mikrophonsignalen x1, x2 also nur ein vernachlässigbarer Anteil der Nutzsignalquelle 322 enthalten ist. Zu diesem Zweck umfasst die Anordnung 300 optional einen Nutzsignaldetektor 390, der beispielsweise ausgelegt ist, um zu erkennen, wenn das Nutzsignal von der Nutzsignalquelle 320 unterhalb eines vorgegebenen oder variablen Schwellpegels liegt. Zu diesem Zweck empfängt der Nutzsignaldetektor 390 beispielsweise das erste Mikrophonsignal x1 und das zweite Mikrophonsignal x2 (oder aber auch, alternativ, nur eines der Mikrophonsignale). Bei dem Nutzsignaldetektor 390 kann es sich beispielsweise um einen Sprachdetektor handeln, der erkennt, wenn ein Sprachsignal vorliegt (falls beispielsweise nur Sprachsignale als Nutzsignale betrachtet werden). Der Nutzsignaldetektor 390 kann somit als eine Ansteuereinrichtung für die Adaptionssteuerung 386, 388 dienen, und (optional) die zu den einstellbaren Filtern 340, 350 gehörigen Adaptionssteuerungen 386, 388 so ansteuern, dass eine Veränderung bzw. Adaption von deren Filterparametern nur dann erfolgt, wenn der Audioinhalt des Nutzsignals in den Mikrophonsignalen x1, x2 schwächer als ein vorgegebener oder variabler Schwellwert ist.
  • Unabhängig davon, ob ein Nutzsignaldetektor 390 eingesetzt wird (bevorzugt aber in Verbindung mit dem Einsatz eines Nutzsignaldetektors 390) können die zu den einstellbaren Filtern 340, 350 gehörigen Adaptionssteuerungen 386, 388 ausgelegt sein, um die jeweiligen Filterparameter so einzustellen, dass beispielsweise eine Leistung oder Energie des ersten Ausgangssignals e1 bzw. des zweiten Ausgangssignals e2 durch eine Veränderung der Filterparameter verringert wird, oder dass die genannte Leistung oder Energie durch eine Veränderung der Filterparameter minimiert wird. In anderen Worten, bei der Einstellung der Filterparameter kann eine Veränderung der Filterparameter beispielsweise nur in der Art zugelassen sein, dass die in dem ersten Ausgangssignal e1 enthaltene Leistung oder Energie und/oder die in dem zweiten Ausgangssignal e2 enthaltene Leistung oder Energie verringert wird. Die Leistung oder Energie in dem ersten Ausgangssignal e1 bzw. in dem zweiten Ausgangssignal e2 kann somit auch als ein quadratischer Fehler aufgefasst werden, der eine Abweichung beispielsweise zwischen dem Signal x1' und dem ersten verzerrten Teilsignal y2' bzw. zwischen dem Signal x2' und dem zweiten verzerrten Teilsignal y2'' beschreibt.
  • In anderen Worten, es wird bevorzugt, die Filterparameter beispielsweise des ersten einstellbaren Filters 340 (durch die zugehörige Adaptionssteuerung 386) so zu verändern, dass eine Abweichung zwischen dem Signal x1' und dem ersten verzerrten Teilsignal y2' im Hinblick auf ein Abstandsmaß reduziert oder minimiert wird. Bei dem Abstandsmaß kann es sich beispielsweise um eine beliebige mathematische Norm des Differenzsignals bzw. Fehlersignals e1 handeln. In analoger Weise können die Filterparameter des zweiten einstellbaren Filters 350 (durch die zugehörige Adaptionssteuerung 388) eingestellt werden.
  • Weitere Details im Hinblick auf eine Adaptionssteuerung von überwachten Filtern sind beispielsweise den Veröffentlichungen [16] und [17] entnehmbar. Bei einer bevorzugten Implementierung des erfindungsgemäßen Konzepts wird eine Adaptionssteuerung in Anlehnung an Gleichung 2 der Veröffentlichung [17] verwendet. Die im Rahmen der vorliegenden Erfindung verwendete Adaptionssteuerung unterscheidet sich von der in [17] gezeigten Adaptionssteuerung dadurch, wie die beiden Leistungsdichtespektren berechnet werden. Im Rahmen der vorliegenden Erfindung wird bevorzugt ein Leistungsdichtespektrum des Ausgangssignals der blinden Quellentrennung (BSS) geschätzt. Ferner wird zusätzlich bevorzugt ein Leistungsdichtespektrum eines Differenzsignals (z.B: eines Signals e1, e2) zwischen einem Mikrofonsignal und einem Ausgangssignal der blinden Quellentrennung geschätzt.
  • 4 zeigt ein Blockschaltbild eines erfindungsgemäßen Signaltrenners gemäß einem vierten Ausführungsbeispiel der vorliegenden Erfindung. Der Signaltrenner der 4 ist in seiner Gesamtheit mit 400 bezeichnet. Der Signaltrenner 400 gemäß 4 ist dem Signaltrenner 300 gemäß 3 sehr ähnlich, so dass gleiche Merkmale bzw. Signale in den 3 und 4 mit gleichen Bezugszeichen bezeichnet sind.
  • Der Signaltrenner 400 gemäß 4 unterscheidet sich von dem Signaltrenner 300 gemäß 3 im Wesentlichen dadurch, dass der Signaltrenner 400 unter Verwendung zweiter Selektoren 410, 420 umkonfigurierbar ist. Ferner kann der blinde Quellentrenner 330 in dem Signaltrenner 400 gemäß 4 wahlweise mit oder ohne Nebenbedingung betrieben werden. In anderen Worten, eine Verzerrung zwischen dem ersten Mikrophonsignal x1 und dem ersten Teilsignal y2 bzw. zwischen dem zweiten Mikrophonsignal x2 und dem zweiten Teilsignal y2 kann entweder begrenzt oder freigegeben sein.
  • Es wird davon ausgegangen, dass in einem ersten Konfigurationszustand der blinde Quellentrenner 330 mit Nebenbedingungen arbeitet, und dass der blinde Quellentrenner 330 als das erste Teilsignal y1 ein Signal ausgibt, dessen Verzerrungen gegenüber dem ersten Mikrophonsignal x1 begrenzt bzw. reduziert oder minimiert ist. In diesem Fall leitet der erste Selektor 410 das erste Teilsignal y1 als Signal z1 zu dem zweiten Selektor 420 weiter. Der zweite Selektor 420 leitet das Signal z1 sodann an den ersten Ausgang als erstes Ausgangssignal a1 weiter. Der erste Selektor 410 leitet ferner das zweite Teilsignal y2 als Signal z2 an das erste einstellbare Filter 340 und an das zweite einstellbare Filter 350 weiter. Der Selektor 2 leitet ferner das Signal e2 an den zweiten Ausgang als Signal a2 weiter. Der optionale Allpass bzw. Verzögerer 382 ist in diesem Zustand aktiv, ebenso wie der zweite Differenzbilder 370. Das zweite einstellbare Filter 350 leitet in dem beschriebenen Betriebszustand das Signal z2 unverändert als Signal y2'' zu dem zweiten Differenzbilder 370 weiter. In dem genannten Zustand können optional der erste Differenzbilder 360, das erste einstellbare Filter 340 und der erste Allpass bzw. Verzögerer 380 deaktiviert sein, da das Signal e1 nicht verwendet wird. Das zweite einstellbare Filter 350 kann im übrigen auch deaktiviert oder überbrückt sein.
  • In einem zweiten Betriebszustand wird der blinde Quellentrenner 330 mit Nebenbedingungen betrieben, wobei das zweite Teilsignal y2 basierend auf dem zweiten Mikrophonsignal x2 des Nutzsignal darstellt. In diesem Fall leitet der erste Selektor 410 das zweite Teilsignal y2 als Signal z1 zu dem zweiten Selektor 420 weiter. Der zweite Selektor 420 leitet in dem zweiten Betriebszustand das Signal z1 zu dem zweiten Ausgang als zweites Ausgangssignal a2 weiter. Ferner leitet der erste Selektor das erste Teilsignal y1, das in dem genannten Betriebszustand im Wesentlichen den Audioinhalt des Störsignals umfasst, als Signal z2 zu dem ersten einstellbaren Filter 340 und zu dem zweiten einstellbaren Filter 350 weiter. Das erste einstellbare Filter 340 leitet das Signal z2 bevorzugt unverändert weiter, um das Signal y2' zu erhalten. Der zweite Selektor 420 leitet ferner. das Signal e1 zu dem ersten Ausgang als erstes Ausgangssignal a1 weiter. Der optionale erste Allpass bzw. Verzögerer 380 und der erste Differenzbilder 360 sind in dem genannten Betriebszustand aktiv. Optional können der zweite Allpass bzw. Verzögerer 382, der zweite Differenzbilder 370 und/oder das zweite einstellbare Filter 350 in dem zweiten Betriebszustand deaktiviert sein. Das erste einstellbare Filter 350 kann im übrigen auch deaktiviert oder überbrückt sein.
  • In einem dritten Betriebszustand wird der blinde Quellentrenner 330 ohne Nebenbedingung betrieben wobei das erste Teilsignal y1 im Wesentlichen den Audioinhalt des Störsignals trägt. In diesem Fall leitet der erste Selektor 410 das erste Teilsignal y1 als Signal z2 zu dem ersten einstellbaren Filter 340 und dem zweiten einstellbaren Filter 350 weiter. Der zweite Selektor leitet weiterhin das Signal e1 als erstes Ausgangssignal a1 zu dem ersten Ausgang weiter. Zusätzlich leitet der zweite Selektor 420 das Signal e2 als zweites Ausgangssignal a2 zu dem zweiten Ausgang weiter.
  • In einem vierten Betriebszustand wird der blinde Quellentrenner 330 ohne Nebenbedingung betrieben, wobei das zweite Teilsignal y2 im Wesentlichen den Audioinhalt des Störsignals beschreibt. In diesem Fall leitet der erste Selektor y1 das zweite Teilsignal y2 zu dem ersten einstellbaren Filter 340 und zu dem zweiten einstellbaren Filter 350 weiter. Der zweite Selektor leitet im Übrigen das Signal e1 als erstes Ausgangssignal a1 zu dem ersten Ausgang, sowie das Signal e2 als zweites Ausgangssignal a2 zu dem zweiten Ausgang.
  • Der Signaltrenner 400 kann somit je nach den Erfordernissen angepasst werden. Die Schaltungsanordnung 400 kann ferner ausgelegt sein, um nur einen der genannten Betriebszustände oder eine Teilmenge der genannten Betriebszustände annehmen zu können.
  • 5 zeigt ein Blockschaltbild eines blinden Quellentrenners zum Einsatz in den erfindungsgemäßen Schaltungsanordnungen. Der blinde Quellentrenner gemäß der 5 ist in seiner Gesamtheit mit 500 bezeichnet. Der blinde Quellentrenner 500 empfängt als ein erstes Eingangssignal 510 beispielsweise das erste Mikrophonsignal x1, und als ein zweites Eingangssignal 512 beispielsweise das zweite Mikrophonsignal x2. Der blinde Quellentrenner 500 ist ferner ausgelegt, um als ein erstes Ausgangssignal 520 das erste Teilsignal y1 zu erzeugen, und um als ein zweites Ausgangssignal 522 das zweite Teilsignal y2 zu erzeugen.
  • Der Quellentrenner 500 umfasst beispielsweise zwei Filter/Kombinierer 530, 532. So empfängt beispielsweise der erste Filter/Kombinierer 530 das erste Eingangssignal 510 und das zweite Eingangssignal 512, und liefert das erste Ausgangssignal 520. Der zweite Filter/Kombinierer 532 empfängt ebenso das erste Eingangssignal 510 und das zweite Eingangssignal 512, und liefert das zweite Ausgangssignal 522. Im Übrigen sei darauf hingewiesen, dass die beiden Filter/Kombinierer 530, 532 auch in einer Einheit ausgeführt sein können.
  • Ein Parametereinsteller 540 ist ausgelegt, um die Filterparameter des ersten Filters/Kombinierers 530 sowie des zweiten Filters/Kombinierers 532 einzustellen. Der Parametereinsteller 540 empfängt zu diesem Zweck beispielsweise die beiden Eingangssignale 510, 512 sowie alternativ oder zusätzlich die beiden Ausgangssignale 520, 522. Der Parametereinsteller 540 ist dabei ausgelegt, um beispielsweise eine Signalstatistik der Eingangssignale 510, 512 und/oder der Ausgangssignale 520, 522 auszuwerten, und die Filterparameter so einzustellen, dass eine statistische Unabhängigkeit zwischen den beiden Ausgangssignalen 520, 522 verbessert bzw. optimiert oder maximiert wird. In anderen Worten, der Parametereinsteller 540 ist beispielsweise ausgelegt, um die Filterparameter in eine solche Richtung bzw. in einer solchen Weise zu verändern, dass die statistische Unabhängigkeit der Ausgangssignale 520, 522 verbessert (vergrößert) bzw. zumindest nicht verschlechtert wird. Optional kann der Parametereinsteller 540 zusätzlich eine Signalverzerrung zwischen dem ersten Eingangssignal 510 und dem ersten Ausgangssignal 520 und/oder zwischen dem zweiten Eingangssignal 512 und dem zweiten Ausgangssignal 522 mit berücksichtigten, um die Filterparameter so einzustellen bzw. einzuregeln oder zu optimieren, dass die Signalverzer rung eine vorgegebene maximal zulässige Signalverzerrung nicht überschreitet. Somit kann der Filterparametereinsteller 540 ausgelegt sein, um einen durch eine Kostenfunktion festgelegten Kompromiss zwischen einer statistischen Unabhängigkeit der Ausgangssignale 520, 522 und einer Verzerrung der Ausgangssignale 520, 522 gegenüber den Eingangssignalen 510, 512 zu erreichen.
  • Für Details im Hinblick auf ein Durchführen einer blinden Quellentrennung wird auf die diesbezügliche Literatur und insbesondere auf die Veröffentlichung [14] verwiesen.
  • Weitere Details im Hinblick auf eine blinde Quellentrennung sind ferner in [18] erklärt. Als Maß für eine statistische Unabhängigkeit der Ausgangssignale kann beispielsweise eine Kullback-Leibler-Distanz verwendet werden. Alternativ können als Maße für die statistische Unabhängigkeit auch eine maximale Entropie, eine minimale wechselseitige Transinformation oder eine Negentropy verwendet werden. Die genannten Maße für die statistische Unabhängigkeit sind beispielsweise in [1] beschrieben.
  • 6 zeigt einen Signalflussplan eines erfindungsgemäßen Signaltrenners 100 gemäß 1. Der Signalflussplan gemäß der 6 ist in seiner Gesamtheit mit 600 bezeichnet und bechreibt ein System, bei dem sowohl die Quellentrennung als auch die Entfernung des Audioinhalts der Störquelle aus dem zweiten Mikrophonsignal unter Verwendung von Signalen in einem Frequenzbereich erfolgt. So wird das Mikrophonsignal x1(t) durch eine Zeitfensterung 610 in einzelne Signalabschnitte unterteilt. Liegt das Zeitsignal x1(t) beispielsweise in Form von Abtastwerten einer bestimmten Abtastrate vor, so kann ein Ausschnitt x1(t1...t2) beispielsweise eine Anzahl von N Abtastwerte zwischen den Zeitpunkten t1 und t2 umfassen (wobei N bevorzugt in einem Bereich zwischen 16 und 4.096 liegt). Auf einen Ausschnitt x1(t1...t2) wird dann eine Transformation angewendet, die aus dem Signalausschnitt einen Satz von Spektralkoeffizien ten erzeugt. Beispielsweise kann eine diskrete Fourier-Transformation 620 eingesetzt werden, um aus dem Signalausschnitt x1(t1...t2) im Zeitbereich einen Satz von Spektralköeffizienten x11)t1...t2 bis x1I)t1...t2 zu erzeugen (wobei I die Anzahl an verschiedenen Frequenzbändern bezeichnet, und wobei ω1 bis ωI die verschiedenen Frequenzbänder beispielsweise einer diskreten Fourier-Transformation bezeichnen). Eine analoge Verarbeitung kann im Übrigen auch für das zunächst als Zeitsignal vorliegende zweite Mikrophonsignal x2(t) erfolgen, um für einen Zeitabschnitt des zweiten Mikrophonsignals einen Satz von Spektralkoeffizienten x21)t1...t2 bis x2I)t1...t2 zu erhalten.
  • Ein blinder Signaltrenner 630 empfängt den ersten Satz von Spektralkoeffizienten, die das erste Mikrophonsignal x1(t) in einem Zeitabschnitt repräsentieren, und den zweiten Satz von Spektralkoeffizienten, die das zweite Mikrophonsignal x2(t) in einem Zeitabschnitt repräsentieren. Der blinde Quellentrenner 630 verarbeitet somit die beiden Sätze von Spektralkoeffizienten und liefert die Teilsignale y1, y2 wiederum als zwei Sätze von Spektralkoeffizienten (y11)t1...t2 bis y1I)t1...t2 und y21)t1...t2 bis y2I)t1...t2) Der Satz von Spezialkoeffizienten, der das erste Teilsignal y1 beschreibt, wird mittels einer Transformation wieder in ein Zeitsignal zurückgewandelt. So kann beispielsweise eine inverse diskrete Fourier-Transformation 640 eingesetzt werden. Damit wird das erste Teilsignal y1 bzw. das Ausgangssignal a1 in einem Zeitbereich (beispielsweise zwischen den Zeitpunkten t1 und t2, oder in einem anderen Zeitbereich) erhalten.
  • Ferner kann beispielsweise das Signal e1 als Differenz zwischen dem zweiten Mikrophonsignal x2 und dem zweiten Teilsignal y2 gebildet werden. Die Differenzbildung kann, wie in der 6 gezeigt, separat für verschiedene Spektralbereiche erfolgen. Die so erhaltenen Spektralkoeffizienten des Signals e2 in einem bestimmten Zeitintervall (mit e21)t1...t2 bis e2I)t1...t2 bezeichnet) werden dann bei spielsweise mit Hilfe einer inversen diskreten Fourier-Transformation 660 wieder in ein Zeitsignal zurück gewandelt werden.
  • Es sei darauf hingewiesen, dass auch die Verarbeitung in den Anordnungen 200, 300 und 400 ganz oder teilweise in einem Spektralbereich erfolgen kann. So ist beispielsweise die Ausführung der einstellbaren Filter 340 in einem spektralen Bereich besonders vorteilhaft, da eine Filterung beispielsweise in dem ersten einstellbaren Filter 340 lediglich eine Multiplikation der Spektralkoeffizienten, die das Signal z2 beschreiben, mit zugeordneten Filterkoeffizienten umfasst. Die gesamte Filter-Verarbeitung ist damit in die einzelnen Frequenzbereiche separiert, wodurch eine Einstellung der Filterkoeffizienten unabhängig voneinander ermöglicht wird. Somit vereinfacht sich die Implementierung im Vergleich zu einer Zeitbereichsimplementierung ganz wesentlich. Die einzelnen Filterkoeffizienten der einstellbaren Filter 340, 350 können somit beispielsweise unabhängig voneinander eingestellt werden.
  • Details im Hinblick auf eine Verarbeitung in einem Frequenzbereich sind beispielsweise [2] und [3] zu entnehmen.
  • Neben einer Durchführung der Verarbeitung im Frequenzbereich ist im übrigen auch eine Verarbeitung in einem Zeitbereich oder eine gemischte Verarbeitung teils im Zeitbereich und teils im Frequenzbereich möglich (vergleiche zum Beispiel [4]).
  • 7 zeigt ein Blockschaltbild eines erfindungsgemäßen Signaltrenners gemäß einem weiteren Ausführungsbeispiel der vorliegenden Erfindung. Der Signaltrenner gemäß der 7 ist. in seiner Gesamtheit mit 700 bezeichnet. Bei dem Signaltrenner 700 wird davon ausgegangen, dass P Mikrophonsignale von P Mikrophonen 710A710P zur Verfügung stehen. Die Mikrophonsignale sind mit x1 bis xP bezeichnet. Ein Quellentrenner (bzw. blinder Quellentrenner) 730 empfängt die P Mikrophonsignale x1 bis xP und erzeugt Q Teilsignale y1 bis yQ, wobei die Teilsignale y1 bis yQ Audioinhalte von Q verschiedenen Quellen beschreiben.
  • Es wird im Folgenden davon ausgegangen, dass es erwünscht ist, die Signale von Q–I Signalquellen an die Ausgänge weiterzuleiten. Ferner wird davon ausgegangen, dass es erwünscht ist, die Signale von I Störquellen aus den Ausgangssignalen auszublenden. Zu diesem Zweck ist ein Selektor 740 ausgelegt, um I Teilsignale der Teilsignale y1 bis yQ an P Blöcke von Filtern 746A746P weiterzuleiten. Jeder der Blöcke 746A746P umfasst I einstellbare Filter mit zugehörigen Adaptionssteuerungen 747A747P. Beispielsweise umfasst ein erster Block 746A I einstellbare Filter 750A750I, wobei das i-te einstellbare Filter innerhalb eines Blockes als zu filterndes Eingangssignal das i-te Störsignal (aus den Signalen zQ-I+1 bis zQ) empfängt. Die Ausgänge der I einzelnen einstellbaren Filter des p-ten Blockes von Filtern wirken im Übrigen auf das p-te Mikrophonsignal xp. Zumindest ein Block 746A746P der P Filterblöcke ist ausgelegt, um die I Störsignale aus dem p-ten Mikrophonsignal zu entfernen, um ein Signal ep zu erhalten. Ein jeder der Filterblöcke 746A746P ist dabei ausgelegt, um die I Störsignale in individuell einstellbarer Weise zu verzerren, und dann die verzerrten Signale aus dem jeweiligen (z.B. p-ten) Mikrophonsignal (beispielsweise durch eine Differenzbildung) zu entfernen. Die Einstellung der Parameter bzw. Koeffizienten der Einzelfilter für die I Störsignale erfolgt dabei (durch die zugehörigen Adaptionssteuerungen 747A747P) basierend auf dem Differenzsignal, das durch das Entfernen bzw. Subtrahieren der I verzerrten Störsignale aus dem jeweiligen (z.B. p-ten) Mikrophonsignal entsteht.
  • Die Adaptionssteuerungen 747A747P können im übriegn beispielsweise über einen optionalen Nutzsignaldetektor 748 angesteuert werden, wobei der Nutzsignaldetektor 748 von seiner Funktion her dem Nutzsignaldetektor 390 gemäß 3 entspricht.
  • Ein Ausgangsselektor 780 ist im Übrigen ausgelegt, um zu den Ausgängen die von Störsignalen befreiten Mikrophonsignale (z. B. die Signale e1 bis eP) weiterzuleiten. Alternativ dazu kann der Selektor 780 auch konfiguriert werden, um beispielsweise Nutzsignale z1 bis zQ-I zu den Ausgängen weiterzuleiten. Die Nutzsignale z1 bis zQ-I sind typischerweise (aber nicht notwendigerweise) direkt verwendbar, wenn der Quellentrenner eine Nebenbedingung aufweist.
  • 8 zeigt ein Flussdiagramm eines ersten erfindungsgemäßen Verfahrens gemäß einem Ausführungsbeispiel der vorliegenden Erfindung. Das Verfahren gemäß der 8 ist in seiner Gesamtheit mit 800 bezeichnet. Das Verfahren ist geeignet, um ein erstens Ausgangssignal, das einen Audioinhalt einer Nutzsignalquelle in einem ersten Mikrophonsignal beschreibt, zu bestimmen, und um ferner ein zweites Ausgangssignal, das einen Audioinhalt der Nutzsignalquelle in einem zweiten Mikrophonsignal beschreibt, zu bestimmen. Das Verfahren umfasst in einem ersten Schritt 810 ein Empfangen von zwei Mikrophonsignalen und ein Trennen von Audioinhalten von zumindest zwei Signalquellen, um ein erstes Teilsignal zu erhalten, das im Wesentlichen einen Audioinhalt einer ersten Signalquelle beschreibt, und das ein erstes Ausgangssignal darstellt, und um ein zweites Teilsignal zu erhalten, das im Wesentlichen einen Audioinhalt einer zweiten Signalquelle beschreibt. Das Verfahren umfasst in einem zweiten Schritt 820 ein Einstellen von Parametern einer Verarbeitungsvorschrift zur Erzeugung des ersten Teilsignals derart, dass eine Verzerrung des ersten Teilsignals gegenüber dem ersten Mikrophonsignal kleiner als eine Maximalverzerrung ist. Das Verfahren 800 umfasst ferner in einem dritten Schritt 830 ein Einstellen von Parametern einer Verarbeitungsvorschrift zur Erzeugung des zweiten Teilsignals derart, dass eine Verzerrung des zweiten Teilsignals gegenüber dem zweiten Mikrophonsignal kleiner als eine Maximalverzerrung ist. Das Verfahren umfasst ferner in einem vierte Schritt 840 ein Entfernen eines zweiten Teilsignals aus dem zweiten Mikrophonsignal, um das zweite Ausgangssignal zu erhalten, in dem das zweite Teilsignal reduziert ist. Das Verfahren 800 gemäß 8 kann im Übrigen um all diejenigen Schritte ergänzt werden, die in Hinblick auf die erfindungsgemäßen Vorrichtung erläutert wurden.
  • 9 zeigt ein Flussdiagramm eines zweiten erfindungsgemäßen Verfahrens gemäß einem Ausführungsbeispiel der vorliegenden Erfindung. Das Verfahren gemäß der 9 ist in seiner Gesamtheit mit 900 bezeichnet und dient einer Bestimmung eines ersten Ausgangssignals, das einen Audioinhalt einer Nutzsignalquelle in einem ersten Mikrophonsignal beschreibt, und zum Bestimmen eines zweiten Ausgangssignals, das einen Audioinhalt der Nutzsignalquelle in einem zweiten Mikrophonsignal beschreibt. Das Verfahren 900 umfasst in einem ersten Schritt 910 ein Empfangen von zwei Mikrophonsignalen sowie ein Trennen von Audioinhalten von zumindest zwei Signalquellen, um ein Teilsignal zu erhalten, das im Wesentlichen einen Audioinhalt einer Störsignalquelle beschreibt. Das Verfahren 900 umfasst in einem zweiten Schritt 920 ein Verzerren des Teilsignals, um ein erstes verzerrtes Teilsignal zu erhalten, und in einem dritten Schritt 930 ein Verzerren des Teilsignals, um ein zweites verzerrtes Teilsignal zu erhalten. Das Verfahren 900 umfasst ferner in einem vierten Schritt 940 ein Entfernen des ersten verzerrten Teilsignals aus dem ersten Mikrophonsignal, sowie in einem fünften Schritt 950 ein Entfernen des zweiten verzerrten Teilsignal auf dem zweiten Mikrophonsignal. Das Verfahren 900 umfasst ferner in einem sechsten Schritt ein Einstellen von Filterparametern des ersten einstellbaren Filters, um einen Audioinhalt der Störsignalquelle in dem ersten Mikrophonsignal zu reduzieren, sowie in einem siebten Schritt 970 ein Einstellen von Filterparametern des zweiten einstellbaren Filters, um einen Audioinhalt der Störsignalquelle in dem zweiten Mikrophonsignal zu reduzieren.
  • Das Verfahren 900 gemäß der 9 kann um all diejenigen Schritte ergänzt werden, die im Hinblick auf die erfindungsgemäßen Vorrichtungen beschrieben wurden.
  • Ferner kann das erfindungsgemäße Verfahren, abhängig von den Gegebenheiten, in Hardware oder in Software implementiert werden. Die Implementation kann auf einem digitalen Speichermedium, beispielsweise einer Diskette, CD, DVD, ROM, PROM, EPROM, EEPROM oder einem Flash-Speichermedium, mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das entsprechende Verfahren ausgeführt wird. Allgemein besteht die Erfindung also auch in einem Computer-Programm-Produkt mit auf einem maschinenlesbaren Träger gespeicherten Programm-Code zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt, kann die Erfindung somit als ein Computer-Programm mit einem Programm-Code zur Durchführung des Verfahrens realisiert werden, wenn das Computer-Programm auf einem Computer abläuft.
  • Im Folgenden werden die Kerngedanken der vorliegenden Erfindung noch einmal kurz zusammengefasst. Zur Erleichterung des Verständnisses wird im Folgenden die Erfindung zuerst für den Fall P = 2 Sensoren und Q = 2 Quellensignalen erläutert. Ein Blockschaltbild einer Vorrichtung bzw. eines Verfahrens für P = Q = 2 ist in 4 dargestellt. Wie oben beschrieben bildet das blinde Quellentrennungssystem (BSS-System) 330 eine erste Stufe, welche an bzw. von den P = 2 Sensoren x1, x2 eine Überlagerung der Q = 2 statistisch unabhängigen Quellensignale aufnimmt. Das blinde Quellentrennungssystem (BSS-System) 330 liefert Idealerweise an den zwei Ausgängen bzw. BSS-Ausgängen y1, y2 jeweils eines der zwei Signale der Punktquellen. In realistischen Anwendungsszenarien können darin (in den Signalen y1, y2) zusätzlich zum jeweils gewünschten Punktquelhensignal noch Restanteile des anderen Quellensignals enthalten sein. Außerdem kann das blinde Quellentrennungssystem (BSS-System) 330 üblicherweise die Quellensignale nur bis auf eine beliebige Filterung bestimmen. Durch Einbeziehung einer Nebenbedingung, welche über ein Distanzmaß die Eingänge x1, x2 und die Ausgänge y1, y2 des BSS-Systems verkoppelt (vergleiche z. B. [14]) kann jedoch erreicht werden, dass das BSS-System keine beliebige Filterung der getrennten Punktquelle durchführt. In diesem Fall entsprechen die getrennten Quellensignale y1, y2 idealerweise jeweils dem Anteil im Sensorsignal x1 bzw. x2, der von der ersten Quelle 320 (Quelle 1) bzw. von der zweiten Quelle 322 (Quelle 2) stammt (vergleiche [14]).
  • Je nachdem, ob ein BSS-System 330 mit oder ohne der oben beschriebenen Nebenbedingung gewählt wurde, unterscheidet sich die Art der Nachverarbeitung. Durch den zweiten Selektor 420 (Selektor 2) gemäß 4 kann durch eine geeignete Auswahl der Ausgangssignale zwischen den beiden Nachverarbeitungsmethoden, im Folgenden Methode A und Methode B genannt, umgeschaltet werden. Methode A benötigt ein BSS-System mit Nebenbedingungen, wobei Methode B eine Nebenbedingung nicht zwingend erforderlich macht.
  • Bei beiden Methoden wird zuerst in dem ersten Selektor 410 (Selektor 1) entschieden, ob das Signal y1 oder das Signal y2 die gewünschte Punktquelle enthält. Das gewünschte Punktquellensignal wird dann auf den Kanal z1 und das Störquellensignal auf den Kanal z2 gegeben. Es ist anzumerken, dass in realistischen Anwendungsszenarien noch Restanteile des jeweiligen anderen Quellensignals vorhanden sind. Im Folgenden werden nun die Methoden A und B erläutert:
  • Methode A
  • Für den Fall, dass die gewünschte Punktquelle sich im Kanal y1 befindet (also dass der Kanal y1 im Wesentlichen den Audioinhalt der gewünschten Punktquelle darstellt), verbindet der erste Selektor 410 (Selektor 1) den Kanal y1 mit z1. Durch die Nebenbedingung (des blinden Signaltrenners 330) enthält z1 bereits die richtige Raumimpulsantwort, die die Ausbreitung von der ersten Quelle 320 (Quelle 1) zu dem ersten Sensor bzw. Schallaufnehmer oder Mikrophon (Sensor 1) beschreibt. Damit kann z1 folglich von dem zweiten Selektor 420 (Selektor 2) auf den ersten Ausgang (Ausgang 1). durchgeschaltet werden (und bildet somit das erste Ausgangssignal a1).
  • Befindet sich die gewünschte Punktquelle im Kanal y2, so verbindet der erste Selektor 410 (Selektor 1) den Kanal y2 mit z1. Durch die Nebenbedingung enthält z1 in diesem Fall die Raumimpulsantwort von der zweiten Quelle 322 (Quelle 2) zu dem zweiten Sensor bzw. Schallaufnehmer oder Mikrophon (Sensor 2). Deshalb schaltet der zweite Selektor 420 (Selektor 2) in diesem Fall den Kanal z1 auf dem zweiten Ausgang (Ausgang 2) durch (um das zweite Ausgangssignal a2 zu erhalten).
  • Die Raumimpulsantwort von der ersten Quelle 320 (Quelle 1) zu dem zweiten Sensor bzw. Schallaufnehmer oder Mikrophon (Sensor 2) wird in dem ersten Fall in dem Signal e2 wiederhergestellt. In diesem Fall wird das Signal e2 durch den zweiten Selektor 420 (Selektor 2) auf den zweiten Ausgang (Ausgang 2) durchgeschaltet (um das zweite Ausgangssignal a2 zu bilden).
  • In dem zweiten Fall wird die Raumimpulsantwort von der zweiten Quelle 322 (Quelle 2) zu dem ersten Sensor bzw. Schallaufnehmer oder Mikrophon (Sensor 1) benötigt. Diese wird in dem Signal e1 wiederhergestellt. Anschließend wird das Signal e1 durch den zweiten Selektor 420 (Selektor 2) an den ersten Ausgang (Ausgang 1) durchgeschaltet (um das erste Ausgangssignal a1 zu bilden).
  • Die Signale e1 und e2 werden generiert, indem das Signal z2 (welches das Störsignal enthält) mit den adaptiven Filtern 340 (auch mit h1 bezeichnet) und 350 (auch mit h2 bezeichnet) verbunden wird und dann von den Referenzsignalen subtrahiert wird. Durch die Referenzsignale werden jeweils die mittels der Allpässe 380 (auch als Allpass a1 bezeichnet) bzw. 382 (auch als Allpass a2 bezeichnet) bearbeiteten Sensorsignale x1 bzw. x2 miteinbezogen. Als Spezialfälle können die Allpässe 380 (Allpass a1) und 382 (Allpass a2) auch als reine Verzögerungsglieder gewählt werden.
  • Die bereits oben beschriebene Technik der adaptiven Filterung nach [12] wird zur Adaption der Filter 340 (h1), 350 (h2) angewendet. In anderen Worten, es werden Ausgangskanäle eines mehrkanaligen Quellentrennungssystems mit jeweils einkanaligen adaptiven Filtern verbunden, welche als Referenzsignale verzögerte Mikrophonsignale miteinbeziehen. Adaptive teildiskrete Filter stellen dabei eine weitverbreitete Technik in der digitalen Signalverarbeitung dar [12]. Das Prinzip eines adaptiven Filters besteht darin, Filterkoeffizienten so zu bestimmen, dass das Ausgangssignal des Systems bzw. des adaptiven Filters bei bekanntem Eingangssignal einem Referenzsignal angenähert wird (vergleiche z. B. [12]). Dies kann beispielsweise dadurch erreicht werden, indem ein Fehlersignal ep (n) nach einem, bestimmten Kriterium (üblicherweise nach einem mittleren quadratischen Fehler) minimiert wird. So kann beispielsweise für das Fehlersignal gelten e1(n) = x1'(n) – y2'(n)wobei n beispielsweise einen Zeitpunkt eines Abtastwerts oder ein Zeitintervall beschreibt, und wobei der mittlere quadratische Fehler (also die mittlere Leistung oder Energie des Fehlersignals eP bzw. e1) beispielsweise durch eine Mittelung über der Zeit und/oder über der Frequenz bestimmt werden kann.
  • In den Signalen e1, e2 wird somit die unerwünschte Punktquelle unterdrückt. Dadurch dass als Referenzsignale (x1', x2') die Sensorsignale (bzw. davon durch die Allpässe 380, 382 abgeleitete Signale) benutzt werden, sind sowohl jeweils die gewünschte Punktquelle sowie die unterdrückte Punktquelle in den Signalen e1, e2 räumlich korrekt dargestellt. Außerdem können dadurch, dass man durch die Sensorsignale jeweils ein Referenzsignal generiert, zur Adaption der Filter 340 (h1) 350 (h2) effiziente Algorithmen für überwachte adaptive Filterung benutzt werden.
  • Im Gegensatz zu der weiter unten beschriebenen Methode B können die adaptive Filter 340 (h1) und 350 (h2) bei der Methode A auch durch einen konstanten Faktor 1 ersetzt werden (also entfallen). Dieser für die Praxis relevante Spezialfall führt zu einer Vereinfachung des Systems. Zusammen mit einer möglichen Vereinfachung der Allpässe 380 (Allpass a1) und 382 (Allpass a2) als reine Verzögerungsglieder ergeben sich damit zwei neue Blockschaltbilder.
  • In 1 ist ein vereinfachtes System dargestellt für den Fall, dass das gewünschte Quellensignal in y1 vorliegt, d. h. für den Fall dass der erste Selektor 410 (Selektor 1) den BSS-Ausgang y1 mit z1 verbindet. In anderen Worten, das Quellensignal bzw. Nutzquellensignal erscheint an dem BSS-Ausgang y1. Das Störquellensignal erscheint hingegen an dem BSS-Ausgang y2.
  • In 2 ist ein vereinfachtes System dargestellt für den Fall, dass das gewünschte Quellensignal in y2 vorliegt, d. h. für den Fall dass der erste Selektor 410 (Selektor 1) den BSS-Ausgang y2 mit z1 verbindet. In anderen Worten, das Quellensignal bzw. Nutz-Quellensignal erscheint an dem BSS-Ausgang y2, während hingegen das Stör-Quellensignal an dem BSS-Ausgang y1 erscheint.
  • Methode B
  • Bei der Methode B ist die Nebenbedingung bei dem BSS-System bzw. bei dem blinden Kanalschätzer nicht zwingend vorgeschrieben bzw. optional. Deshalb kann nicht angenommen werden, dass die Signale y1 und y2 die Raumimpulsantworten der beiden Quellen 320, 322 (Quelle 1, Quelle 2) zu den Sensoren bzw. Schallaufnehmern oder Mikrophonen (Sensor 1, Sensor 2) enthalten. Aus diesem Grund schaltet bei Methode B der zweite Selektor 420 (Selektor 2) das Signal e1 an den ersten Ausgang (Ausgang a1) als erstes Ausgangssignal a1 durch, und schaltet ferner das Signale e2 auf den zweiten Ausgang (Ausgang 2) als zweites Ausgangssignal a2 durch (vergleiche 4).
  • Eine Erweiterung der Erfindung auf einem BSS-System (bzw. System zur blinden Quellentrennung) mit P Sensoren und Q Punktquellen ist in 7 gezeigt. Die Anzahl der Störquelle wird mit I bezeichnet. Damit ergeben sich Q – I gewünschte Punktquellen. Das BSS-System 700 liefert Q getrennte Quellen, wobei die Q – I gewünschten Punktquellen von dem ersten Selektor 740 (Selektor 1) den Kanälen z1 bis zQ-I zugeordnet werden. Die Störquellen werden von dem ersten Selektor 740 (Selektor 1) den Kanälen zQ-I+1 bis zQ zugeordnet. Die Kanäle zQ-I+1 bis zQ werden mit den adaptiven Filtern hi,1 bis hi,I verbunden (i = 1, ..., P) und von den Referenzsignalen subtrahiert. In anderen Worten, die Kanäle zQ-I+1 bis zQ werden durch die adaptiven Filter hi,1 bis hi,I verzerrt, und das verzerrte Signal wird von den Referenzsignalen, also beispielsweise den allpass-gefilterten Mikrophonsignalen x1 bis xP, subtrahiert. Durch die Referenzsignale werden somit jeweils die mittels der Allpässe Allpass a1, ..., Allpass aP überarbeiteten Sensorsignale x1, ..., xP miteinbezogen. Als Spezialfall können die Allpässe Allpass a1, ..., Allpass aP auch wieder als reine Verzögerungsglieder gewählt werden. Dies erzeugt die Signale e1, ..., eP, in denen alle Q – I unerwünschten Punktquellen unterdrückt werden. Dadurch, dass als Referenzsignale die Sensorsignale (bzw. Allpass-gefilterte Sensorsignale) benutzt werden, sind sowohl jeweils die gewünschten Punktquellen, sowie die unterdrückten Punktquellen in den Signalen e1, ..., eP räumlich korrekt dargestellt.
  • Bei der Methode A wird wiederum bevorzugt eine BSS mit Nebenbedingungen gewählt. Ausgehend von den Raumimpulsantworten, die die gewünschten Punktquellen in den Signal z1, ..., zQ-I beinhalten, werden dann von dem zweiten Selelctor 780 (Selektor 2) die Signale z1, ..., zQ-I auf die entsprechenden Ausgangskanäle durchgeschaltet. Dies bedeutet, dass eine eventuelle Permutation der BSS-Ausgangssignale, die von dem ersten Selektor 740 (Selektor 1) berücksichtigt wurde, auch von dem zweiten Selektor 780 (Selektor 2) berücksichtigt werden muss. Die Auswahl der Verbindungen von Kanälen z1, ..., zQ-I mit den Ausgängen 1, ..., P durch den Selektor 2 wurde oben für den Fall P = Q = 2 genau diskutiert, und erfolgt hier analog. Die restlichen P – Q + I Ausgangssignale werden aus den Signalen e1, ..., eP ermittelt.
  • Bei der Methode B ist die Nebenbedingung bei dem BSS-System (also beispielsweise bei dem blinden Quellentrenner 730) nicht zwingend vorgeschrieben. Deshalb werden hierbei die Signale e1, ..., eP auf die Ausgänge 1, ..., P durchgeschaltet.
  • Im Folgenden werden noch einige Beobachtungen im Hinblick auf eine praktische Implementierung der vorliegenden Erfindung ausgeführt. Die hier beschriebene Erfindung wurde für akustische Signale mittels Simulationen verifiziert. Dazu wurden in einem halligen Raum die Signale von zwei Punktquellen (Sprachsignale) mittels zweier Mikrophone aufgezeichnet. Hierbei repräsentiert eines der Signale die gewünschte Punktquelle, und das andere Signal die Störquelle. Die Mikrophonsignale werden von einem BSS-Algorithmus bearbeitet, welcher nach einer kurzen Konvergenzzeit an einem der beiden BSS-Ausgangskanäle das gewünschte Sprach signal zusammen mit einem kleinen Restanteil des Störsignals liefert. Der andere BSS-Ausgang liefert das Störsignal zusammen mit einem kleinen Restanteil der gewünschten Punktquelle. Der erste Selektor (Selektor 1) gibt das BSS-Ausgangssignal, welches die Störquelle beinhaltet, an die adaptiven Filter h1,1 und h2,1. Damit wird an den Ausgängen e1 und e2 des Nachverarbeitungsblocks eine räumlich korrekte Darstellung der gewünschten Punktquelle sowie des Restanteils der Störquelle erreicht.
  • Es würden sowohl die Methode A sowie die Methode B mittels Simulationen getestet. Bei beiden Methoden konnte eine räumlich korrekte Darstellung der gewünschten Punkquelle sowie auch der Störquelle erreicht werden. Die beiden Kanäle können beispielsweise durch ein Stereo-Wiedergabesystem, z. B. einen Kopfhörer, abgehört werden.
  • Zusammenfassend lässt sich also festhalten, dass die vorliegende Erfindung ein System zur Wiederherstellung von Rauminformationen bei blinden Quellentrennungssystemen schafft. Konventionelle blinde Quellentrennungssysteme bestimmen aus den Signalmischungen an den Sensoren (bzw. Schallaufnehmern oder Mikrophonen) in jedem Ausgangskanal eine einkanalige Schätzung der jeweils gewünschten Punktquelle zusammen mit eventuell vorhandenen Restanteilen der Störquellen. Die vorliegende Erfindung schafft einen Nachverarbeitungsblock, um die räumliche Information sowohl von der gewünschten Punktquelle als auch von den eventuell noch vorhandenen Störquellen wiederherzustellen. Zur Bestimmung der Ausgangssignale des Nachverarbeitungsblocks werden die Sensorsignale (bzw. Mikrophonsignale) zusammen mit den Ausgangssignalen der blinden Quellentrennung (z. B. den Signalen y1, y2, ..., yQ) benutzt. Die meisten der bereits in der Literatur bekannten ähnlichen Konzepte erreichen nur die räumliche Darstellung der gewünschten Quelle, so dass alle noch vorhandenen Störquellen ebenfalls auf diesen Punkt abgebildet werden.
  • Es ist somit ein wesentliches Konzept bzw. eine Motivation der vorliegenden Erfindung, eine räumliche Information (also eine Information über eine räumliche Lage von Punktquellen) am Ausgang wiederherzustellen, indem auch die ursprünglichen Sensorsignale zusammen mit den Ausgangssignalen der BSS in einem neuen Nachverarbeitungsblock verarbeitet werden.
  • Zusammenfassend lässt sich also festhalten, dass die vorliegende Erfindung einen Signaltrenner schafft, der eine wirksame Entfernung von Störquellen aus einem mehrkanaligen Audiosignal ermöglicht, wobei verbleibende Restanteile der Störquellen auf deren ursprüngliche räumliche Position abgebildet werden. Die vorliegende Erfindung ermöglicht ferner eine Realisierung mit vergleichsweise geringem Aufwand.
  • Literaturverzeichnis
    • [1] A. Hyvärinen, J. Harhunen und E. Oja, Independent Component Analysis, Wiley & Sons, New York, 2001.
    • [2] L. Parra und C. Spence, Convolutive Blind Source Separation of Non-stationary Sources, IEEE Trans. Speech an Audio Processing, S. 320–327, Mai 2000.
    • [3] European Patent EP 1070390 B1 , L. Parra und C. Spence: Convolutive Blind Source Separation Using a Multiple Decorrelation Method, Europäische Patentschrift 1070390 B1, Anmeldetag: 08.04.1999 mit Priorität 08.04.1998, veröffentlicht 22.06.2005 Patentklasse (IPC) H03H 21/00.
    • [4] H. Buchner, R. Aichner und W. Kellermann, Blind Source Sepaaration for Convolutive Mixtures: A Unified Treatment, in Y. Huang, J. Benesty (Hrsg) Audio Signal Processing, Kluwer Academic Publishers, Boston, 2004.
    • [5] T. Hoya, T. Tanaka, A. Cichicki, T. Murakami, G. Hori und J. Chambers, Stereophonic Noise Reduction Using a Combined Sliding Subspace Projection an Adaptive Signal Enhancement, IEEE Trans. Speech an Audio Processing, Bd. 13, Nr. 3, S. 309–320, Mai 2005.
    • [6] J. Allen und D. Berkley, Image Method for Efficiently Simulating Small-Room Acoustics, J. Acoust. Soc. Am., S. 943–950, 1979.
    • [7] J. Garas, Adaptive 3D Sound Systems, Kluwer Academic Publishers, 2000.
    • [8] Patent WO2004/006624 AI, E. Schaeffer: Sound Source Spatialization System, Anmeldetag: 27.06.2003 mit Priorität 02.07.2002, veröffentlicht 15.01.2004, Patentklasse (IPC) H04S 1/00.
    • [9] Herbert Buchner, Robert Aichner und Walter Kellermann, Relation between Blind System Identification and Convolutive Blind Source Separation, Hands-free Speech Communication and Microphone Arrays Workshop, Piscataway, NJ, USA, 2005.
    • [10] Herbert Buchner, Robert Aichner, Jochen Stenglein, Heinz Teutsch und Walter Kellermann, Simultaneous Localization of Multiple Sound Sources using Blind Adaptive MIMO Filtering, Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing (ICASSP), Philadelphia, USA, März, 2005.
    • [11] R. Martin, Noise Power Spectral Density Estimation Based on Optimal Smoothing and Minimum Statistics, IEEE Trans. Speech and Audio Processing, Bd. 9, Nr. 5, S. 504–512, Juli, 2001
    • [12] S. Haykin, Adaptive Filter Theory, 4. Auflage, Prentice-Hall, 2002.
    • [13] T. Takatani, T. Nishikawa, H. Saruwatari und K. Shikano, High-Fidelity Blind Separation of Acoustic Signals using SIMO-Model-Based ICA with Information-Geometric Learning, Proc. Int. Workshop on Acoustic Echo and Noise Control (IWAENC), Sept. 2003, Kyoto, Japan.
    • [14] K. Matsuoka und S. Nakshima, Minimal Distortion Principle for Blind Source Separation, Proc. Int. Conf. on Independent Component Analysis and Blind Signal Separation, Dezember 2001, San Diego, CA, USA.
    • [15] T. J. Klasen, M. Moonen, T. Van den Bogaert und J. Wouters, "Preservation of interaural time delay for binaural hearing aids through multi-channel Wiener filtering based noise reduction", Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing (ICASSP), Philadelphia, USA, März 2005.
    • [16] W. Herbordt, F. Nakamura, W. Kellermann „Multi-channel estimation of power spectral density of noise for mixtures of non-stationary signals", IPSJ SIG Technical Reports, vol. 2004, no. 131, pp. 211–216, Kyoto, Japan, Dec. 2004
    • [17] W. Herbordt. T. Trini, W. Kellermann „Robust spatial estimation of the signal-to-interference ratio for non-stationary mixtures", Proc. Int. Workshop on Acoustic Echo and Noise Control, pp. 247–250, Kyoto, Japan, Sept. 2003
    • [18] Herbert Buchner, Robert Aichner, Walter Kellermann "TRINICON: A Versatile Framework for Multichannel Blind Signal Processing", Proc. IEEE Int. Conf. On Acoustics, Speech and Signal Processing (ICASSP), pp. 889–892, vol. 3, Montreal, Kanada, Mai 2004
    • [19] S. Ikeda, N. Murata, "A method of ICA in timefrequency domain", in Proc. Int. Symposium on Independent Component Analysis and Blind Signal Separation, pp. 365–371, Aussois, Frankreich, Januar 1999

Claims (25)

  1. Signaltrenner (100; 200; 400; 700) zum Bestimmen eines ersten Ausgangssignals (a1), das einen Audioinhalt einer Nutz-Signalquelle (120; 320) in einem ersten Mikrophonsignal (x1) beschreibt, und zum Bestimmen eines zweiten Ausgangssignals (a2), das einem Audioinhalt der Nutz-Signalquelle in einem zweiten Mikrophonsignal (x2) beschreibt, mit folgenden Merkmalen: einem Quellentrenner (130; 330) zum Empfangen der zwei Mikrophonsignale von zwei Schallaufnehmern, die in einem Raum angeordnet sind, um Audiosignale von in dem Raum befindlichen Signalquellen zu empfangen, und zum Trennen von Audioinhalten von zumindest zwei Signalquellen, wobei der Quellentrenner ausgelegt ist, um ein erstes Teilsignal (y1) zu erhalten, das im Wesentlichen einen Audioinhalt einer ersten Signalquelle beschreibt, und das das erste Ausgangssignal darstellt, und um ein zweites Teilsignal (y2) zu erhalten, das im Wesentlichen einen Audioinhalt einer zweiten Signalquelle beschreibt, wobei der Quellentrenner ausgelegt ist, um Parameter einer Verarbeitungsvorschrift zur Erzeugung des ersten Teilsignals aus den Mikrophonsignalen so einzustellen, dass eine Verzerrung des ersten Teilsignals gegenüber dem ersten Mikrophonsignal kleiner als eine Maximalverzerrung ist, und um Parameter einer Verarbeitungsvorschrift zur Erzeugung des zweiten Teilsignals aus den Mikrophonsignalen so einzustellen, dass eine Verzerrung des zweiten Teilsignals gegenüber dem zweiten Mikrophonsignal kleiner als eine Maximalverzerrung ist; und einem Signalentferner (140; 370) zum Entfernen des zweiten Teilsignals aus dem zweiten Mikrophonsignal, um das zweite Ausgangssignal zu erhalten, in dem das zweite Teilsignal reduziert ist.
  2. Signaltrenner (100; 200; 400; 700) gemäß Anspruch 1, bei dem der Quellentrenner (130; 330) ausgelegt ist, um die Audioinhalte der zumindest zwei Signalquellen aufgrund von deren räumlichen Lage in dem Raum oder aufgrund von deren statistischen Eigenschaften zu trennen.
  3. Signaltrenner (100; 200; 400; 700) gemäß Anspruch 1 oder 2, bei dem der Quellentrenner (130; 330; 500) ausgelegt ist, um die Parameter der Verarbeitungsvorschrift zur Erzeugung des ersten Teilsignals (y1) in Abhängigkeit von einem Maß für die Verzerrung des ersten Teilsignals gegenüber dem ersten Mikrophonsignal (x1) zu bestimmen, um die Verzerrung des ersten Teilsignals gegenüber dem ersten Mikrophonsignal nach oben hin zu begrenzen; und bei dem der Quellentrenner ausgelegt ist, um die Parameter der Verarbeitungsvorschrift zur Erzeugung des zweiten Teilsignals (y2) in Abhängigkeit von einem Maß für die Verzerrung des zweiten Teilsignals gegenüber dem zweiten Mikrophonsignal (x2) zu bestimmen, um die Verzerrung des zweiten Teilsignals gegenüber dem zweiten Mikrophonsignal nach oben hin zu begrenzen.
  4. Signaltrenner (100; 200; 400; 700) gemäß einem der Ansprüche 1 bis 3, bei dem der Quellentrenner (130; 330) ausgelegt ist, um die Parameter der Verarbeitungsvorschriften zur Erzeugung des ersten Teilsignals (y1) und des zweiten Teilsignals (y2) durch eine Optimierung unter Verwendung einer Kostenfunktion zu ermitteln, wobei die Kostenfunktion ein Maß für eine statistische Unabhängigkeit zwischen den Teilsignalen, ein Maß für eine Verzerrung zwischen dem ersten Mikrophonsignal (x1) und dem ersten Teilsignal sowie ein Maß für eine Verzerrung zwischen dem zweiten Mikrophonsignal (x2) und dem zweiten Teilsignal (y2) umfasst, wobei die Optimierung ausgelegt ist, um einen durch die Kostenfunktion bestimmten Kompromiss zwischen einer möglichst großen statistischen Unabhängigkeit der Teilsignale, einer möglichst geringen Verzerrung zwischen dem ersten Mikrophonsignal und dem ersten Teilsignal sowie einer möglichst geringen Verzerrung zwischen dem zweiten Mikrophonsignal und dem zweiten Teilsignal zu erzielen.
  5. Signaltrenner (100; 200; 400; 700) gemäß Anspruch 4, bei dem das Maß für die statistische Unabhängigkeit zwischen dem ersten Teilsignal und dem zweiten Teilsignal auf einer Bestimmung einer Kullback-Leibler-Distanz, einer maximalen Entropie, einer minimalen Transinformation und/oder einer Negentropie basiert.
  6. Signaltrenner (100; 200; 400; 700) gemäß Anspruch 4 oder 5, bei dem die Kostenfunktion eine Nicht-Gaussheit, einer Nicht-Weißheit und/oder einer Nicht-Stationarität von Wahrscheinlichkeitsdichtefunktionen der Teilsignale (y1, y2) berücksichtigt.
  7. Signaltrenner (100; 200; 400; 700) gemäß einem der Ansprüche 3 bis 6, bei dem das Maß für die Verzerrung zwischen dem ersten Mikrophonsignal (x1) und dem ersten Teilsignal (y1) ein Betrag oder eine Norm einer Differenz zwischen Werten des ersten Mikrophonsignals (x1) und des ersten Teilsignals (y1) ist; und bei dem das Maß für die Verzerrung zwischen dem zweiten Mikrophonsignal (x2) und dem zweiten Teilsignal (y2) ein Betrag oder eine Norm einer Differenz zwischen Werten des zweiten Mikrophonsignals (x2) und des zweiten Teilsignals (y2) ist.
  8. Signaltrenner (100; 200; 400; 700) gemäß einem der Ansprüche 1 bis 7, bei dem der Signalentferner eine Verzögerungseinrichtung (136; 382) zum Verzögern des zweiten Mikrophonsignals (x2), um eine Verarbeitungsdauer bei einer Bestimmung des zweiten Teilsignals (y2) auszugleichen und um ein verzögertes zweites Mikrophonsignal (x2') zu erhalten, und einen Differenzbilder (140; 370) zum Bestimmen des zweiten Ausgangssignals (a2) als eine Differenz zwischen dem verzögerten zweiten Mikrophonsignal und dem zweiten Teilsignal umfasst.
  9. Signaltrenner (100; 200; 400; 700) gemäß einem der Ansprüche 1 bis 8, wobei der Signaltrenner ausgelegt ist, um das erste Mikrophonsignal (x1), das zweite Mikrophonsignal (x2), das erste Teilsignal (y1) und/oder das zweite Teilsignal (y2) durch eine Mehrzahl von Signalanteilen in einer Mehrzahl von Audiofrequenzbereichen darzustellen, um die Audioinhalte der zumindest zwei Signalquellen basierend auf einer Analyse in einem Spektralbereich zu trennen, und um das zweite Teilsignal aus dem zweiten Mikrophonsignal durch Differenzbildung für eine Mehrzahl von Signalanteilen in einer Mehrzahl von Audiofrequenzbereichen zu entfernen.
  10. Signaltrenner (100; 200; 400; 700) gemäß einem der Ansprüche 1 bis 9, wobei die erste Signalquelle die Nutzsignalquelle bildet.
  11. Signaltrenner (100; 200; 400; 700) gemäß einem der Ansprüche 1 bis 10, bei dem der Quellentrenner ausgelegt ist, um Signalanteile von zwei Signalquellen zu trennen, um zu erkennen, welche der zwei Signalquellen eine Nutzsignalquelle und welche der zwei Signalquellen eine Störsignalquelle ist, um den Audioinhalt der Nutzsignalquelle als das erste Teilsignal auszugeben, und um den Audioinhalt der Störsignalquelle als das zweite Teilsignal auszugeben.
  12. Signaltrenner (300; 400; 700) zum Bestimmen eines ersten Ausgangssignals (a1) das einen Audioinhalt einer Nutz-Signalquelle (320) in einem ersten Mikrophonsignal beschreibt, und zum Bestimmen eines zweiten Ausgangssignals (a2), das einen Audioinhalt der Nutz-Signalquelle in einem zweiten Mikrophonsignal (x2) beschreibt, mit folgenden Merkmalen einem Quellentrenner (330; 740) zum Empfangen der zwei Mikrophonsignale von zwei Schallaufnehmern, die in einem Raum angeordnet sind, um Audiosignale von in dem Raum befindlichen Signalquellen zu empfangen, und zum Trennen von Audioinhalten von zumindest zwei Signalquellen, wobei der Quellentrenner ausgelegt ist, um ein Teilsignal (y2) zu erhalten, das im Wesentlichen einen Audioinhalt einer Stör-Signalquelle (322) beschreibt; einem einstellbaren Filter (340, 350; 746A, 746P) zum Verzerren des Teilsignals, um ein erstes verzerrtes Teilsignal (y2') zu erhalten, und zum Verzerren des Teilsignals, um ein zweites verzerrtes Teilsignal (y2'') zu erhalten; einem Signalentferner (360, 370) zum Entfernen des ersten verzerrten Teilsignals aus dem ersten Mikrophonsignal, um ein erstes bereinigtes Mikrophonsignal (e1) zu erhalten, das das erste Ausgangssignal (a1) bildet, und zum Entfernen des zweiten verzerrten Teilsignals aus dem zweiten Mikrophonsignal, um ein zweites bereinigtes Mikrophonsignal (e2) zu erhalten, das das zweite Ausgangssignal (a2) bildet; und einem Parametereinsteller, um Filterparameter des einstellbaren Filters einzustellen, um einen Audioinhalt der Stör-Signalquelle in dem ersten Ausgangssignal zu reduzieren, und um Filterparameter des einstellbaren Filters einzustellen, um einen Audioinhalt der Stör-Signalquelle in dem zweiten Ausgangssignal zu reduzieren.
  13. Signaltrenner (300; 400; 700) gemäß Anspruch 12, bei dem der Quellentrenner (130; 330) ausgelegt ist, um die Audioinhalte der zumindest zwei Signalquellen aufgrund von deren räumlichen Lage in dem Raum oder aufgrund von deren statistischen Eigenschaften zu trennen.
  14. Signaltrenner (300; 400; 700) gemäß Anspruch 12 oder 13, bei dem der Quellentrenner (130; 330) ausgelegt ist, um die Parameter der Verarbeitungsvorschriften zur Erzeugung des ersten Teilsignals (y1) und des zweiten Teilsignals (y2) durch eine Optimierung unter Verwendung einer Kostenfunktion zu ermitteln, wobei die Kostenfunktion ein Maß für eine statistische Unabhängigkeit zwischen den Teilsignalen umfasst, und wobei der Quellentrenner ausgelegt ist, um durch die Optimierung eine statistische Unabhängigkeit der Teilsignale im Vergleich zu einem Zustand vor der Optimierung zu vergrößern.
  15. Signaltrenner (300; 400; 700) gemäß Anspruch 14, bei dem das Maß für die statistische Unabhängigkeit zwischen dem ersten Teilsignal und dem zweiten Teilsignal auf einer Bestimmung einer Kullback-Leibler-Distanz, einer maximalen Entropie, einer minimalen Transinformation und/oder einer Negentropie basiert.
  16. Signaltrenner (300; 400; 700) gemäß Anspruch 12 oder 13, bei dem die Kostenfunktion eine Nicht-Gaussheit, einer Nicht-Weißheit und/oder einer Nicht- Stationarität von Wahrscheinlichkeitsdichtefunktionen der Teilsignale (y1, y2) berücksichtigt.
  17. Signaltrenner (300; 400; 700) gemäß einem der Ansprüche 12 bis 16, bei dem der Parametereinsteller ausgelegt ist, um die Leistung in dem ersten bereinigten Mikrophonsignal und die Leistung in dem zweiten bereinigten Mikrophonsignal zu bestimmen, und um die Filterparameter des einstellbaren Filters (340, 350; 746A, 746P) so zu verändern, dass eine Leistung in dem ersten bereinigten Mikrophonsignal (e1) verringert wird, und um die Filterparameter des einstellbaren Filters so zu verändern, dass eine Leistung in dem zweiten bereinigten Mikrophonsignal (e2) verringert wird.
  18. Signaltrenner (300; 400; 700) gemäß einem der Ansprüche 12 bis 17, bei dem der Parametereinsteller ausgelegt ist, um die Filterparameter des einstellbaren Filters (340; 350; 746A, 746P) durch eine Optimierung so einzustellen, dass eine Leistung in dem ersten bereinigten Mikrophonsignal (e1) gegenüber einem Zustand vor der Optimierung verringert wird, und um die Filterparameter des einstellbaren Filters so einzustellen, dass eine Leistung in dem zweiten bereinigten Mikrophonsignal (e2) gegenüber einem Zustand vor der Optimierung verringert wird.
  19. Signaltrenner (300; 400; 700) gemäß einem der Ansprüche 12 bis 18, bei dem der Parametereinsteller einen Nutzsignal-Detektor (390) umfasst, der ausgelegt ist, um zu erkennen, wann ein Nutzsignal von der Nutzsignalquelle (320) mit zumindest einer minimalen Nutzsignalstärke in dem ersten Mikrophonsignal (x1) oder in dem zweiten Mikrophonsignal (x2) vorliegt, und um die Filterparameter des einstellbaren Filters (340, 350; 746A, 746P) nur dann zu verändern oder zu optimieren, wenn kein Nutzsignal mit zumindest der minimalen Nutzsignalstärke vorliegt.
  20. Signaltrenner (300; 400; 700) gemäß einem der Ansprüche 12 bis 19, wobei der Signaltrenner ausgelegt ist, um das erste Mikrophonsignal (x1) das zweite Mikrophonsignal (x2), das erste Teilsignal (y1) und/oder das zweite Teilsignal (y2) durch eine Mehrzahl von Signalanteilen in einer Mehrzahl von Audiofrequenzbereichen darzustellen, und um die Audioinhalte der zumindest zwei Signalquellen (320, 322) basierend auf einer Analyse in einem Spektralbereich zu trennen, und wobei das einstellbare Filter (340, 350; 746A, 746P) ausgelegt ist, um verschiedene Spektralanteile des Teilsignals separat zu verzerren; und wobei der Signalentferner (360, 360) ausgelegt ist, um einen Audioinhalt der Stör-Signalquelle in dem ersten bereinigten Mikrophonsignal (e1) durch eine separate Verarbeitung verschiedener Spektralanteile zu reduzieren, und um einen Audioinhalt der Stör-Signalquelle in dem zweiten bereinigten Mikrophonsignal (e2) durch eine separate Verarbeitung verschiedener Spektralanteile zu reduzieren.
  21. Signaltrenner (300; 400; 700) gemäß einem der Ansprüche 12 bis 20, bei dem das erste bereinigte Mikrofonsignal (e1) ein Ausgangssignal des Signalentferners darstellt.
  22. Signaltrenner (300; 400; 700) gemäß einem der Ansprüche 12 bis 21, bei dem der Signalentferner einen Differenzbilder umfasst, der ausgelegt ist, um das erste verzerrte Teilsignal (y2') von dem ersten Mikrofonsignal (x1) oder von einer Allpass-gefilterten Version (x1') des ersten Mikrofonsignals zu subtrahieren, wobei ein von dem Differenzbilder gebildetes Differenzsignal das erste bereinigte Mikrofonsignal (e1) dar stellt, und um das zweite verzerrte Teilsignal (y2'') von dem zweiten Mikrofonsignal (x2) oder von einer Allpass-gefilterten Version des zweiten Mikrofonsignals (x2') zu subtrahieren, wobei ein von dem Differenzbilder gebildetes Differenzsignal das zweite bereinigte Mikrofonsignal (e2) darstellt.
  23. Verfahren zum Bestimmen eines ersten Ausgangssignals (a1), das einen Audioinhalt einer Nutzsignalquelle in einem ersten Mikrophonsignal (x1) beschreibt, und zum Bestimmen eines zweiten Ausgangssignals (a2), das einen Audioinhalt der Nutzsignalquelle in einem zweiten Mikrophonsignal (x2) beschreibt, mit folgenden Schritten: Empfangen (810) der zwei Mikrophonsignale von zwei Schallaufnehmern, die in einem Raum angeordnet sind, um Audiosignale von in dem Raum befindlichen Signalquellen zu empfangen; Trennen (810) von Audioinhalten von zumindest zwei Signalquellen, um ein erstes Teilsignal (y1) zu erhalten, das im Wesentlichen eine Audioinhalt der ersten Signalquelle beschreibt, und das das erste Ausgangssignal darstellt, und um ein zweites Teilsignal (y2) zu erhalten, das im Wesentlichen einen Audioinhalt einer zweiten Signalquelle beschreibt; Einstellen (820) von Parametern einer Verarbeitungsvorschrift zur Erzeugung des ersten Teilsignals aus den Mikrophonsignalen derart, dass eine Verzerrung des ersten Teilsignals gegenüber dem ersten Mikrophonsignal kleiner als eine Maximalverzerrung ist; Einstellen (830) von Parametern einer Verarbeitungsvorschrift zur Erzeugung des zweiten Teilsignals aus dem Mikrophonsignalen derart, dass eine Verzerrung des zweiten Teilsignals gegenüber dem zweiten Mikrophonsignal kleiner als eine Maximalverzerrung ist; und Entfernen (840) des zweiten Teilsignals aus dem zweiten Mikrophonsignal, um das zweite Ausgangssignal zu erhalten, in dem das zweite Teilsignal reduziert ist.
  24. Verfahren zum Bestimmen eines ersten Ausgangssignals (a1), das einen Audioinhalt einer Nutzsignalquelle in einem ersten Mikrophonsignal (x1) beschreibt, und zum Bestimmen eines zweiten Ausgangssignals (a2), das einen Audioinhalt einer Nutzsignalquelle in einem zweiten Mikrophonsignal (x2) beschreibt, mit folgenden Schritten: Empfangen (910) der zwei Mikrophonsignale, die Signale von zwei Schallaufnehmern, die in einem Raum angeordnet sind, um Audiosignale von in dem Raum befindlichen Signalquellen zu empfangen, beschreiben; Trennen von Audioinhalten von zumindest zwei Signalquellen, um ein Teilsignal (y2) zu erhalten, das im Wesentlichen einen Audioinhalt einer Stör-Signalquelle beschreibt; Verzerren (930) des Teilsignals in einem einstellbaren Filter, um ein erstes verzerrtes Teilsignal (y2') zu erhalten; Verzerren (940) des Teilsignals in einem einstellbaren Filter, um ein zweites verzerrtes Teilsignal (y2'') zu erhalten; Entfernen (940) des ersten verzerrten Teilsignals aus dem ersten Mikrophonsignal, um ein erstes bereinigtes Mikrophonsignal zu erhalten, das das erste Ausgangssignal bildet; Entfernen (950) des zweiten verzerrten Teilsignals aus dem zweiten Mikrophonsignal, um ein zweites bereinigtes Mikrophonsignal zu erhalten, das das zweite Ausgangssignal bildet; Einstellen (960) von Filterparametern des einstellbaren Filters, um einen Audioinhalt der Stör-Signalquelle in dem ersten bereinigten Mikrophonsignal zu reduzieren; und Einstellen (970) von Filterparametern des einstellbaren Filters, um einen Audioinhalt der Störsignalquelle in dem zweiten bereinigten Mikrophonsignal zu reduzieren.
  25. Computerprogramm zur Durchführung eines Verfahrens gemäß Anspruch 23 oder 24, wenn das Computerprogramm auf einem Computer abläuft.
DE102006027673A 2006-06-14 2006-06-14 Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm Ceased DE102006027673A1 (de)

Priority Applications (9)

Application Number Priority Date Filing Date Title
DE102006027673A DE102006027673A1 (de) 2006-06-14 2006-06-14 Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm
CN200780022297XA CN101484938B (zh) 2006-06-14 2007-06-12 信号分离器、基于麦克风信号确定输出信号的方法
AU2007260233A AU2007260233B2 (en) 2006-06-14 2007-06-12 Signal separator, method for determining output signals on the basis of microphone signals, and computer program
JP2009514695A JP2009540378A (ja) 2006-06-14 2007-06-12 信号分離器、マイクロフォン信号に基づいて出力信号を決定するための方法、及び、コンピュータプログラム
US12/308,284 US8090111B2 (en) 2006-06-14 2007-06-12 Signal separator, method for determining output signals on the basis of microphone signals, and computer program
EP07764622A EP2027581B1 (de) 2006-06-14 2007-06-12 Signaltrenner, verfahren zur bestimmung von ausgangssignalen auf grundlage von mikrofonsignalen und rechnerprogramm
DK07764622.2T DK2027581T3 (da) 2006-06-14 2007-06-12 Signalseparator, fremgangsmåde til bestemmelse af outputsignaler på basis af mikrofonsignaler og computerprogram
AT07764622T ATE547788T1 (de) 2006-06-14 2007-06-12 Signaltrenner, verfahren zur bestimmung von ausgangssignalen auf grundlage von mikrofonsignalen und rechnerprogramm
PCT/EP2007/005182 WO2007144147A1 (en) 2006-06-14 2007-06-12 Signal separator, method for determining output signals on the basis of microphone signals, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102006027673A DE102006027673A1 (de) 2006-06-14 2006-06-14 Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm

Publications (1)

Publication Number Publication Date
DE102006027673A1 true DE102006027673A1 (de) 2007-12-20

Family

ID=38353840

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102006027673A Ceased DE102006027673A1 (de) 2006-06-14 2006-06-14 Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm

Country Status (9)

Country Link
US (1) US8090111B2 (de)
EP (1) EP2027581B1 (de)
JP (1) JP2009540378A (de)
CN (1) CN101484938B (de)
AT (1) ATE547788T1 (de)
AU (1) AU2007260233B2 (de)
DE (1) DE102006027673A1 (de)
DK (1) DK2027581T3 (de)
WO (1) WO2007144147A1 (de)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8892432B2 (en) * 2007-10-19 2014-11-18 Nec Corporation Signal processing system, apparatus and method used on the system, and program thereof
US8812309B2 (en) 2008-03-18 2014-08-19 Qualcomm Incorporated Methods and apparatus for suppressing ambient noise using multiple audio signals
JP5605573B2 (ja) * 2009-02-13 2014-10-15 日本電気株式会社 多チャンネル音響信号処理方法、そのシステム及びプログラム
US9064499B2 (en) * 2009-02-13 2015-06-23 Nec Corporation Method for processing multichannel acoustic signal, system therefor, and program
DK2234415T3 (da) * 2009-03-24 2012-02-13 Siemens Medical Instr Pte Ltd Fremgangsmåde og akustisk signalbearbejdningssystem til binaural støjreduktion
US8787591B2 (en) * 2009-09-11 2014-07-22 Texas Instruments Incorporated Method and system for interference suppression using blind source separation
DE102009052992B3 (de) * 2009-11-12 2011-03-17 Institut für Rundfunktechnik GmbH Verfahren zum Abmischen von Mikrofonsignalen einer Tonaufnahme mit mehreren Mikrofonen
US9299360B2 (en) * 2011-01-13 2016-03-29 Nec Corporation Speech processing apparatus, control method thereof, storage medium storing control program thereof, and vehicle, information processing apparatus, and information processing system including the speech processing apparatus
TWI457789B (zh) * 2012-05-30 2014-10-21 Wistron Corp 電子裝置和輸入指令方法
CN103236264B (zh) * 2013-05-03 2015-07-29 湖北文理学院 一种用于声源分离的编解码方法
PL3058566T3 (pl) 2013-10-18 2018-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie współczynników widmowych widma sygnału audio
EP3335217B1 (de) * 2015-12-21 2022-05-04 Huawei Technologies Co., Ltd. Signalverarbeitungsvorrichtung und -verfahren
KR101737270B1 (ko) 2016-04-25 2017-05-19 울산대학교 산학협력단 능동 방향성 이득 조정 가능한 양이 보청기 시스템
CN107871510B (zh) * 2017-07-07 2019-11-26 西南交通大学 一种零吸引变核宽度的最大熵回声消除方法
CN107578782B (zh) * 2017-07-07 2019-09-24 西南交通大学 一种变核宽度的最大熵子带回声消除方法
CN107369458B (zh) * 2017-07-07 2019-09-24 西南交通大学 一种基于熵吸引的最大熵子带回声消除方法
CN107527622B (zh) * 2017-07-07 2019-09-24 西南交通大学 一种基于最大熵的变步长符号子带回声消除方法
CN107818793A (zh) * 2017-11-07 2018-03-20 北京云知声信息技术有限公司 一种可减少无用语音识别的语音采集处理方法及装置
CN108053834B (zh) * 2017-12-05 2020-02-21 北京声智科技有限公司 音频数据处理方法、装置、终端及系统
CN108198569B (zh) * 2017-12-28 2021-07-16 北京搜狗科技发展有限公司 一种音频处理方法、装置、设备及可读存储介质
CN108597531B (zh) * 2018-03-28 2021-05-28 南京大学 一种通过多声源活动检测来改进双通道盲信号分离的方法
CN113348508A (zh) * 2019-01-23 2021-09-03 索尼集团公司 电子设备、方法和计算机程序
CN110310683B (zh) * 2019-07-01 2021-07-06 科大讯飞股份有限公司 录音处理方法及装置
KR20220104690A (ko) * 2019-10-04 2022-07-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 소스 분리

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6130949A (en) * 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
US20050060142A1 (en) * 2003-09-12 2005-03-17 Erik Visser Separation of target acoustic signals in a multi-transducer arrangement

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL101556A (en) * 1992-04-10 1996-08-04 Univ Ramot Multi-channel signal separation using cross-polyspectra
US6167417A (en) 1998-04-08 2000-12-26 Sarnoff Corporation Convolutive blind source separation using a multiple decorrelation method
JP3831220B2 (ja) * 2001-09-25 2006-10-11 日本電信電話株式会社 雑音抑圧方法及びその装置、雑音抑圧プログラム並びにそのプログラム記録媒体
FR2842064B1 (fr) 2002-07-02 2004-12-03 Thales Sa Systeme de spatialisation de sources sonores a performances ameliorees
JP2006100869A (ja) * 2004-09-28 2006-04-13 Sony Corp 音声信号処理装置および音声信号処理方法
US8873768B2 (en) * 2004-12-23 2014-10-28 Motorola Mobility Llc Method and apparatus for audio signal enhancement
JP2007279517A (ja) * 2006-04-10 2007-10-25 Kobe Steel Ltd 音源分離装置、音源分離装置用のプログラム及び音源分離方法
KR101178801B1 (ko) * 2008-12-09 2012-08-31 한국전자통신연구원 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6130949A (en) * 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
US20050060142A1 (en) * 2003-09-12 2005-03-17 Erik Visser Separation of target acoustic signals in a multi-transducer arrangement

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MATSUOKA, K.: Minimal distortion principle for blind source separation. In: SICE 2002. Procee- dings of the 41th SICE Annual Conference, August 2002, Vol. 4, S. 2138-21
MATSUOKA, K.: Minimal distortion principle for blind source separation. In: SICE 2002. Proceedings of the 41th SICE Annual Conference, August 2002, Vol. 4, S. 2138-21 *
Ryo Mukai u.a.: Real-time blind source separation and DOA estimation using small 3-D microphone array. Vortrag 2005 International Workshop on Acoustic Echo and Noise Control, Eindhoven (NL), Sept. 2005, Verfügbar im Internet: http://iwaenc05 .ele.tue.nl/proceedings/papers/S01-12.pdf *
Tetsuya Hoya u.a.: Sterephonic Noise Reduction Using a Combined Sliding Subspace Projection and Adaptive Signal Enhancement. In: IEEE Trans. on Speech and Audio Processing, Vol. 13, May 2005, No. 3, S. 309-320 *

Also Published As

Publication number Publication date
AU2007260233A1 (en) 2007-12-21
CN101484938B (zh) 2012-02-15
DK2027581T3 (da) 2012-06-18
CN101484938A (zh) 2009-07-15
ATE547788T1 (de) 2012-03-15
US20100232621A1 (en) 2010-09-16
JP2009540378A (ja) 2009-11-19
EP2027581B1 (de) 2012-02-29
US8090111B2 (en) 2012-01-03
WO2007144147A1 (en) 2007-12-21
AU2007260233B2 (en) 2011-09-15
EP2027581A1 (de) 2009-02-25

Similar Documents

Publication Publication Date Title
DE102006027673A1 (de) Signaltrenner, Verfahren zum Bestimmen von Ausgangssignalen basierend auf Mikrophonsignalen und Computerprogramm
DE102004005998B3 (de) Verfahren und Vorrichtung zur Separierung von Schallsignalen
DE112009001003B4 (de) Geräuschunterdrückungssystem mit zwei Mikrophonen
DE60108752T2 (de) Verfahren zur rauschunterdrückung in einem adaptiven strahlformer
DE69827911T2 (de) Verfahren und einrichtung zur mehrkanaligen kompensation eines akustischen echos
EP0948237B1 (de) Verfahren zur Störbefreiung eines Mikrophonsignals
DE102006020832B4 (de) Verfahren zum Unterdrücken von Rückkopplungen bei Hörvorrichtungen
DE102006047986B4 (de) Verarbeitung eines Eingangssignals in einem Hörgerät
DE19715498B4 (de) Stereoklangbildverbesserungsvorrichtungen und -verfahren unter Verwendung von Tabellen
EP3375204B1 (de) Audiosignalverarbeitung in einem fahrzeug
WO2005046194A1 (de) Vorrichtung und verfahren zum verarbeiten eines eingangssignals
DE60029436T2 (de) Akustischer Echokompensator
DE112008003305T5 (de) Bandaufteilungs-Zeitausgleich-Signalverarbeitungs-Vorrichtung
DE102018127071B3 (de) Audiosignalverarbeitung mit akustischer Echounterdrückung
DE102014002899A1 (de) Verfahren, Vorrichtung und Herstellung zur Zwei-Mikrofon-Array-Sprachverbesserung für eine Kraftfahrzeugumgebung
DE102004053790A1 (de) Verfahren zur Erzeugung von Stereosignalen für getrennte Quellen und entsprechendes Akustiksystem
EP2200341B1 (de) Verfahren zum Betrieb eines Hörhilfegerätes sowie Hörhilfegerät mit einer Quellentrennungseinrichtung
EP3065417B1 (de) Verfahren zur unterdrückung eines störgeräusches in einem akustischen system
EP0808076A1 (de) Raumklangsystem
DE102015204253B4 (de) Verfahren zur frequenzabhängigen Rauschunterdrückung eines Eingangssignals sowie Hörgerät
DE69817461T2 (de) Verfahren und Vorrichtung zur optimierten Verarbeitung eines Störsignals während einer Tonaufnahme
EP3355592B1 (de) Verfahren zum betrieb eines binauralen hörgerätesystems
DE102015221764A1 (de) Verfahren zum Angleichen von Mikrofonempfindlichkeiten
DE102019135690A1 (de) Verfahren und Vorrichtung zur Audiosignalverarbeitung für binaurale Virtualisierung
WO2007036443A1 (de) Verfahren zur aktiven geräuschverminderung und eine vorrichtung zur durchführung des verfahrens

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8131 Rejection