DE10223735B4 - Verfahren und Vorrichtung zum Ermitteln von Rhythmuseinheiten in einem Musikstück - Google Patents

Verfahren und Vorrichtung zum Ermitteln von Rhythmuseinheiten in einem Musikstück Download PDF

Info

Publication number
DE10223735B4
DE10223735B4 DE10223735A DE10223735A DE10223735B4 DE 10223735 B4 DE10223735 B4 DE 10223735B4 DE 10223735 A DE10223735 A DE 10223735A DE 10223735 A DE10223735 A DE 10223735A DE 10223735 B4 DE10223735 B4 DE 10223735B4
Authority
DE
Germany
Prior art keywords
bpm
rhythm
audio data
rhythm unit
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE10223735A
Other languages
English (en)
Other versions
DE10223735A1 (de
Inventor
Joerg W. Weissflog
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Music Group IP Ltd
Original Assignee
Red Chip Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Red Chip Co Ltd filed Critical Red Chip Co Ltd
Priority to DE10223735A priority Critical patent/DE10223735B4/de
Priority to US10/202,328 priority patent/US6812394B2/en
Publication of DE10223735A1 publication Critical patent/DE10223735A1/de
Application granted granted Critical
Publication of DE10223735B4 publication Critical patent/DE10223735B4/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/40Rhythm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/076Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/021Indicator, i.e. non-screen output user interfacing, e.g. visual or tactile instrument status or guidance information using lights, LEDs, seven segments displays
    • G10H2220/086Beats per minute [bpm] indicator, i.e. displaying a tempo value, e.g. in words or as numerical value in beats per minute

Abstract

Verfahren zum Ermitteln von Rhythmuseinheiten (BPM) in ein Musikstück bildenden Audiodaten, bei dem die Audiodaten auf mehrere Ermittlungspfade aufgeteilt werden, in denen sie in vorbestimmte Frequenzbänder unterteilt werden, dadurch gekennzeichnet, dass die Audiodaten in den Ermittlungspfaden zur Ermittlung von Einschwingereignissen auf Transienten untersucht werden, wobei die Zeitintervalle zwischen zwei aufeinanderfolgenden Einschwingereignissen erfasst werden, wobei die Zeitintervalle gemittelt und als frequenz-bandspezifische Rhythmuseinheit (BPM) der Audiodaten in dem jeweiligen Ermittlungspfad definiert werden, und wobei aus den frequenzbandspezifischen Rhythmuseinheiten (BPM) der Ermittlungspfade diejenige Rhythmuseinheit ausgewählt wird, die die höchste Schlagzahl aufweist.

Description

  • Die vorliegende Erfindung betrifft allgemein eine Vorrichtung zum Ermitteln von Rhythmuseinheiten in einem Musikstück und insbesondere betrifft sie ein Verfahren und eine Vorrichtung zum Ermitteln der Rhythmuseinheiten in Musikstücken auf Grundlage von digitalen Audiodaten.
  • Vorrichtungen zum Ermitteln von Rhythmuseinheiten in einem Musikstück, auch als BPM-Detektoren bezeichnet (BPM steht für Beats per Minute), dienen dazu, die Schläge pro Minute in einem Musikstück bzw. das Tempo des Musikstücks zu ermitteln. Derartige Vorrichtungen kommen in unterschiedlichsten Bereichen der Musikszene zum Einsatz. Beispielsweise ist es bei Disk-Jockey-Anwendungen erwünscht, das Tempo von zwei unterschiedlichen Musikquellen zu messen, um Tempoanpassungen vornehmen zu können. In MIDI-Anwendungen wird der in Rede stehende BPM-Detektor verwendet, um die Geschwindigkeit eines MIDI-Event-Sequencers mit einer existierenden Audiospur zu synchronisieren. In einem Musik-Datenbanksystem kann durch Rhythmuseinheiten beispielsweise Musik gekennzeichnet und durch ihren BPM-Wert mit Indices versehen werden.
  • Bisherige Echtzeit-Implementierungen von Vorrichtungen zur Ermittlung von Rhythmuseinheiten basieren üblicherweise auf den Prinzipien der Autokorrelation und den Prinzipien eines variablen Schwellenwerts.
  • Üblicherweise erlauben diese beiden Ansätze jedoch keine schnellere Ermittlung als 5 bis 6 Rhythmuseinheiten (BPM).
  • Aus T. Tolonen, M. Karjalainen, „A Computationally Efficient Multipich Analysis Model", IEEE Transactions on Speed and Audio Processing, Vol. 8, No 6, Nov. 2000, S. 708 bis 716 ist ein Verfahren zur Bestimmung von Tonhöhen und Periodizitäten von Audiodaten bekannt. Das Signal wird in mehrere Kanäle getrennt. Es wird die Hüllkurve in jedem Kanal gebildet und aus diesen eine Autokorrelationsfunktion bestimmt. Aus allen Autokorrelationsfunktionen wird eine summierte Autokorrelationsfunktion gebildet für die weitere Analyse. Das Verfahren dient für komplexe Audiosignalverarbeitungsaufgaben, wie etwa Schallquellentrennung, strukturelle Darstellung von Audiosignalen und Inhaltsanalysetechniken.
  • Aus E.D. Scheirer, „Pulse Tracking with a Pitch Tracker", Workshop on Applications of Signal Processing to Audio und Acoustics, 1997, ist ein Rythmusermittlungsverfahren bekannt, das ein Eingangssignal in Frequenzbänder aufteilt und eine Einhüllende jedes Bandes gewinnt. Diese wird differenziert und halbwellengleichgerichtet und sodann auf Grundlage einer Resonanzfilterbandstruktur verarbeitet, die mit Kammfiltern aufgebaut ist. Die Energie jedes Kammfilterausgangs wird berechnet und über die Frequenzbänder summiert. Durch Spitzenwertextrahierung kann ein Wert für die menschliche Rythmuswahrnehmung gewonnen werden.
  • Eine Aufgabe der vorliegenden Erfindung besteht deshalb darin, ein Verfahren zum Ermitteln von Rhythmuseinheiten in digitalen Audiodaten und eine Vorrichtung zur Durchführung des Verfahrens zu schaffen, die bei hoher Ermittlungsgenauigkeit eine schnellere Ermittlung als bislang gewährleisten.
  • Gelöst wird diese Aufgabe hinsichtlich des Verfahrens durch die Merkmale des Anspruchs 1 und hinsichtlich der Vorrichtung durch die Merkmale des Anspruchs 14. Vorteilhafte Weiterbildungen der Erfindung sind in den Unteransprüchen angegeben.
  • Das erfindungsgemäße Verfahren und die erfindungsgemäße Vorrichtung erlauben eine Ermittlungsgenauigkeit von bis zu +/–0,1 Rhythmuseinheiten (BPM) nach einer Messzeit von gerade eben drei Perioden und eine Schnelligkeit von 3 Rhythmuseinheiten (BPM). Wenn das erfindungsgemäße Verfahren und die erfindungsgemäße Vorrichtung für Disk-Jockey-Anwendungen eingesetzt werden, kommt bevorzugt eine Rhythmusperioden-Erfassungsbreite von 60 bis 160 Rhythmuseinheiten (BPM) in Betracht.
  • Mehr im Einzelnen sieht die Erfindung eine Vielzahl von Verarbeitungsblöcken bzw. Ermittlungspfaden vor, die sämtliche parallel von dem digitalen bzw. digitalisierten Audiosignal durchlaufen werden. Am Ausgang der parallelen Ermittlungspfade wählt eine Logikschaltung denjenigen ermittelten Wert an Rhythmuseinheiten aus, der die glaubwürdigste Messung darstellt und dieses Ermittlungsergebnis wird vorzugsweise optisch auf einer geeigneten Anzeige angezeigt.
  • Mehr im Einzelnen überwacht jeder Ermittlungspfad ein sehr kleines Frequenzband, das aus dem gesamten Frequenzband der Audiodaten durch Bandpassfilter gewonnen wird. Ein Transientendetektor ist dem jeweiligen Bandpassfilter nachgeschaltet und wird verwendet, um Einschwingereignisse auf Transienten zu prüfen. Das zwischen zwei aufeinanderfolgenden Einschwingereignissen (Transienten) liegende Zeitintervall wird erfasst und durch einen Periodizitätsdetektor untersucht, wobei ein gemittelter resultierender BPM-Wert zur Anzeige gebracht wird.
  • Mehr im Einzelnen schafft die Erfindung gemäß einem ersten Aspekt ein Verfahren zum Ermitteln von Rhythmuseinheiten (BPM) in (digitalen) Audiodaten, bei dem die Audiodaten auf mehrere Ermittlungspfade aufgeteilt werden,
    • a) in denen sie in vorbestimmte Frequenzbänder unterteilt werden,
    • b) in denen sie zur Ermittlung von Einschwingereignissen (attack events) auf Transienten untersucht werden,
    • c) wobei die Zeitintervalle zwischen zwei aufeinanderfolgenden Einschwingereignissen erfasst werden,
    • d) wobei die Zeitintervalle gemittelt und als frequenzbandspezifische Rhythmuseinheit (BPM) der Audiodaten in dem jeweiligen Ermittlungspfad definiert werden, und bei dem aus den frequenzbandspezifischen Rhythmuseinheiten (BPM) der Ermittlungspfade diejenige Rhythmuseinheit ausgewählt wird, die die höchste Schlagzahl (BPM-Anzahl) aufweist.
  • Wie bereits vorstehend angesprochen, wird die ermittelte Rhythmuseinheit (BPM) bevorzugt optisch angezeigt.
  • Vorteilhafterweise werden die Frequenzbänder für den Schritt a) sehr schmalbandig bzw. mit hohem Q gewählt.
  • Da die in Musikstücken die Rhythmuseinheit festlegenden Instrumente ihren frequenzmäßigen Schwerpunkt im sehr hohen und/oder sehr niedrigen Audio-Frequenz-Spektrum aufweisen, werden die Frequenzbänder der einzelnen Ermittlungspfade entsprechend gewählt.
  • Vorteilhafterweise ist zur Erfassung der Transienten im Schritt b) vorgesehen, die maximale mittlere Energie des Audiosignals im Frequenzbands des jeweiligen Ermittlungspfads als Funktion der Zeit tw zu ermitteln. Dabei ist vorteilhafterweise vorgesehen, dass die Amplitude des Audiosignals zur Ermittlung seiner Energie im Frequenzband des jeweiligen Ermittlungspfads in einem Zeitfenster vorgegebener Länge ins Quadrat erhoben und gemittelt wird. Bevorzugt ist das Zeitfenster ein rechteckiges Integrationsfenster. Die ins Quadrat erhobene Amplitude der Audiodaten wird vorteilhafterweise durch ein Verzögerungselement verzögert, vom Eingangssignal der Verzögerungsleitung subtrahiert und unter Verwendung eines weiteren Verzögerungselements akkumuliert, um das rechteckige Integrationsfenster zu gewinnen, das die mittlere Energie im Frequenzband als Funktion der Zeit tw misst. Um eine überlappende Abfolge aufeinanderfolgender Zeitfenster zu gewährleisten, werden bevorzugt Zeitfenster von aufeinanderfolgenden Energiemittlungswerten mit einem konstanten Faktor c skaliert und mit konstanten Zeitintervallen ts (ts < tw) ausgegeben.
  • Aus den ermittelten Energiewerten wird daraufhin bevorzugt ein lokales Maximum bestimmt, auf das zur Ermittlung der maximalen mittleren Energie der Audiodaten eine lineare Regression angewendet wird. Als lokales Maximum wird derjenige Energiewert bestimmt, der größer als eine festgelegte Anzahl vorausgehender und eine festgelegte Anzahl nachfolgender E nergiewerte ist. Als zusätzliches Kriterium für das lokale Maximum wird außerdem angewendet, dass der betreffende Energiewert größer als ein minimaler Energiepegel bzw. ein separat ermittelter Schwellenwert sein muss.
  • Da die wie vorstehend angeführt in den einzelnen Ermittlungspfaden ermittelte Rhythmuseinheit beispielsweise auch ein Viertel oder die Hälfte oder das doppelte der gesuchten Rhythmuseinheit sein kann, wird in Schritt d) des erfindungsgemäßen Verfahrens die ermittelte Rhythmuseinheit durch Skalieren auf eine Grundrhythmuseinheit rückgeführt. Damit wird sichergestellt, dass kein Mehrfaches der Grundrhythmuseinheit als Rhythmuseinheiten-Ermittlungsergebnis ausgegeben wird.
  • Gemäß einem zweiten Aspekt schafft die vorliegende Erfindung eine Vorrichtung zum Ermitteln der Rhythmuseinheit (BPM) in digitalen Audiodaten zur Durchführung des erfindungsgemäßen Verfahrens mit einem von den Audiodaten beaufschlagten Eingang und einem Ausgang, an welchem die ermittelte Rhythmuseinheit ausgegeben wird. Erfindungsgemäß ist vorgesehen, dass die Ermittlungsvorrichtung mehrere Rhythmuseinheit-Detektoren (BPM-Detektoren) aufweist, die parallel zwischen den Eingang und eine Logikschaltung vor den Ausgang geschaltet sind, wobei die Rhythmuseinheit-Detektoren folgende Bestandteile umfassen:
    • a) einen Bandpassfilter zum Abtrennen eines Frequenzbereichs von dem am Eingang anliegenden Audiosignal, wobei die Bandpassfilter der Rhythmuseinheit-Detektoren zumindest einen Teil der gesamten Bandbreite des Audiosignals abdecken,
    • b) eine Transienten-Erfassungseinrichtung zur Ermittlung von Einschwingereignissen,
    • c) eine Zeiterfassungseinrichtung zum Erfassen der Zeitin tervalle zwischen zwei aufeinanderfolgenden Einschwingereignissen erfasst werden,
    • d) eine Periodizitätsermittlungseinrichtung zum Mitteln der Zeitintervalle und Definieren der gemittelten Zeitintervalle als frequenzbandspezifische Rhythmuseinheit (BPM) der Audiodaten in dem jeweiligen Ermittlungspfad, wobei die Logikschaltung dazu ausgelegt ist, aus den frequenzbandspezifischen Rhythmuseinheiten (BPM) der Ermittlungspfade diejenige auszuwählen, die die höchste Schlagzahl (BPM-Anzahl) aufweist.
  • Bevorzugt ist der Logikschaltung zur optischen Anzeige der ermittelten Rhythmuseinheit (BPM) eine Anzeigeeinrichtung nachgeschaltet.
  • Nachfolgend wird die Erfindung anhand der Zeichnung beispielhaft näher erläutert; in dieser zeigen:
  • 1 schematisch den Aufbau einer Ausführungsform der erfindungsgemäßen Vorrichtung,
  • 2 schematisch den Aufbau eines Fensterintegrators der Transienten-Erfassungseinrichtung eines der Rhythmuseinheit-Detektoren der Vorrichtung von 1,
  • 3 eine Schwellenschaltung der Transienten-Erfassungseinrichtung, der Transienten-Erfassungseinrichtung von einem der Rhythmuseinheit-Detektoren der Vorrichtung von 1,
  • 4 einen Detektor zum Ermitteln eines lokalen Maximums der Transienten-Erfassungseinrichtung von einem der Rhythmuseinheit-Detektoren der Vorrichtung von 1,
  • 5 in Diagrammform eine lineare Regression, die in der Transienten-Erfassungseinrichtung von einem der Rhyth museinheit-Detektoren der Vorrichtung von 1 Anwendung findet,
  • 6 eine Periodizitätsermittlungseinrichtung von einem der Rhythmuseinheit-Detektoren der Vorrichtung von 1 in Gestalt eines Ablaufdiagramms, und
  • 7 schematisch in Gestalt eines Ablaufdiagramms die Funktion der Logikschaltung der Vorrichtung von 1.
  • Die schematisch in 1 gezeigte Ausführungsform einer Vorrichtung zur Ermittlung von Rhythmuseinheiten (BPM) in einem Musikstück umfasst einen Eingang 10 und einen Ausgang 11. Für den Fall, dass es sich bei dem in den Eingang 10 eingespeisten Audiodaten, aus denen eine Rhythmuseinheit ermittelt werden soll, nicht bereits um digitale Audiodaten handelt, folgt, wie in 1 gezeigt, unmittelbar auf den Eingang 1 ein Analog-/Digital-Wandler 12. Die am Ausgang des Analog-/Digital-Wandlers anliegenden digitalen Audiodaten werden in eine Vielzahl von parallel geschalteten Rhythmuseinheit-Detektoren eingespeist, nämlich in Rhythmuseinheit-Detektoren 13, 14, ... n. Die Ausgangssignale der im folgenden näher erläuterten Rhythmuseinheit-Detektoren 13, 14, ... n werden in eine entsprechende Anzahl von Eingängen einer Logikschaltung 5 eingespeist, deren Ausgang mit dem Ausgang 11 der Vorrichtung verbunden ist.
  • Im Folgenden wird der Aufbau der Rhythmuseinheit-Detektoren 13, 14, ... n beispielhaft anhand des Aufbaus des Detektors 13 erläutert, der stellvertretend für die übrigen Detektoren steht, die grundsätzlich denselben Aufbau besitzen.
  • An den Eingang des Detektors 13 schließt sich ein Bandpassfilter 16 an. Dieser Bandpassfilter weist eine sehr kleine Bandbreite bzw. ein sehr hohes Q auf. Die Mittenfrequenzen der Bandpassfilter der verschiedenen Rhythmuseinheit-Detektoren 13, 14, ... n sind so gewählt, dass sie voneinander unterschiedlich sind und insbesondere einen bestimmten Bandbereich der digitalen Audiodaten abdecken. Bevorzugt kommen die Mittenfrequenzen der jeweiligen Bandpassfilter im sehr hohen und sehr niedrigen Frequenzbereich des Audiospektrums zu liegen, um typischerweise Rhythmusinstrumente, wie etwa Basstrommeln und Hi-Hats zu überwachen.
  • Das Ausgangssignal des Bandpassfilters 16 wurde in eine Transienten-Erfassungseinrichtung 17 eingespeist, die dazu dient, Einschwingereignisse (attack events) auf Transienten zu untersuchen, um aus den gefilterten digitalen Audiodaten Rhythmuseinheiten zu ermitteln. Diese Transienten-Erfassungseinrichtung umfasst einen in 2 schematisch gezeigten Fensterintegrator 18, eine in 3 gezeigte Schwellenschaltung 19, einen schematisch in 4 gezeigten Detektor zur Ermittlung eines lokalen Energiemaximums, der allgemein mit der Bezugsziffer 20 bezeichnet ist, und ein lineares Regressionsmittel, dessen Funktion in 5 in Diagrammform gezeigt ist. Außerdem arbeitet die Transienten-Erfassungseinrichtung mit einer Zeitmesseinrichtung 21 zusammen.
  • Nunmehr wird die Arbeitsweise der Transienten-Erfassungseinrichtung 17 zum Wiederaufbau seiner Komponenten im Zusammenhang mit der Zeitmesseinrichtung 21 näher erläutert.
  • Um Transienten des bandpassgefilterten Audiosignals (der digitalen Audiodaten, im folgenden auch als Audiosignal bezeichnet) zu ermitteln, wird das Audiosignal ins Quadrat gehoben und zeitlich gemittelt, mit Hilfe eines Zeitfensters der Länge tw. Um die Rechenlast zu verringern, wird ein Zeitfenster in Gestalt eines rechteckigen Analysefensters bzw.
  • Integrationsfensters gewählt. Dies erlaubt die Verwendung eines sehr einfachen Fenstererzeugungsverfahrens, wie anhand von 2 näher erläutert wird.
  • 2 zeigt, dass das ins Quadrat gesetzte Audiosignal in eine Verzögerungsleitung 22 eingespeist wird. Der Verzögerungsleitung 22 ist ausgangsseitig ein Negierer 23 und ein Summierer 24 nachgeschaltet, der eingangsseitig außerdem vom Eingangssignal in die Verzögerungsleitung 22 beaufschlagt ist. Damit wird das Ausgangssignal der Verzögerungsleitung vom Eingangssignal der Verzögerungsleitung subtrahiert und dieses Subtraktionsergebnis wird akkumuliert unter Verwendung eines weiteren nicht näher gezeigten Verzögerungselements. Das Ergebnis ist ein rechteckiges Integrationsfenster, das die mittlere Energie des Audiosignals im Frequenzband als Funktion der Zeit tb misst. Ein entsprechendes Zeit-Lauf-Diagramm ist im linken unteren Teil von 2 gezeigt.
  • Die gemessenen Energiewerte werden mit einem konstanten Faktor "c" in einem Skalierer 25 skaliert und mit konstanten Zeitintervallen Ts ausgegeben, die unter Verwendung eines Zeitgebers 26 erzeugt werden, der einen Schalter 27 betätigt, und dessen Ausgangssignal außerdem mit einem Zähler 28 verbunden ist. Es ist erwünscht, ts kürzer zu bilden, als tw (beispielsweise ts = 0,5 × tw), um eine Fensterüberlappung zu gewährleisten.
  • Der Zeitgeber erhöht außerdem konstant den Zeitzähler 28 mit ts, um den nachgeschalteten lokalen Maximumdetektor 20 zu beaufschlagen, wie nachfolgend erläutert.
  • Das in den Skalierer 25 eingegebene Signal wird außerdem in die Schwellenschaltung 19 eingespeist, die in 3 schematisch gezeigt ist und nunmehr näher erläutert wird.
  • Um den mittleren Energiepegel des Frequenzbands zu überwachen, wird eine Spitzenwerthalteschaltung verwendet. Diese Spitzenwertschaltung, die in 2 gezeigt ist, besitzt an sich bekannten Aufbau. Die als Spitzenwerthalteschaltung ausgelegte Schwellenschaltung 19 sieht vor, dass das Ausgangssignal der Schaltung um 5 × ts offene Verzögerungsleitung 29 verzögert und in einer Skalierschaltung 30 um den konstanten Faktor "c" skaliert wird, der mit einem Wert kleiner als 1,0 gewählt ist. Die weitere Funktion der Schwellenschaltung ist nachfolgend im Zusammenhang mit dem lokalen Maximumdetektor näher erläutert.
  • Der lokale Maximumdetektor ist in 4 näher gezeigt und mit der Bezugsziffer 20 bezeichnet. Der Eingang des lokalen Maximumdetektors wird mit dem Ausgangssignal des Fensterintegrators 18 beaufschlagt. Insbesondere wird das Ausgangssignal des Fensterintegrators in eine Verzögerungsleitung 31 eingespeist, die bei der dargestellten Ausführungsform aus insgesamt zehn verschachtelten einzelnen Verzögerungselementen besteht, die jeweils mit z–1 bezeichnet sind. Das Ausgangssignal des fünften Verzögerungselements wird als X(n) bezeichnet und es wird angenommen, dass es sich hierbei um das lokale Maximum handelt. Zunächst wird verifiziert, ob die gemessenen Energie X(n) höher als die fünf vorausgehenden und niedriger als die fünf nachfolgenden Energiewerte ist (Schritt S100). Im nächsten Schritt S 102 wird geprüft, ob X(n) die in der Schwellenschaltung 19 von 3 erzeugte Schwelle übersteigt. Um eine BPM- bzw. Rhythmuseinheit-Messung zu vermeiden, wenn kein Audiosignal anliegt, wird außer dem verifiziert, ob X(n) eine definierten minimalen Energiepegel MinLevel übersteigt.
  • Da im später nachfolgenden Schritt S 104 eine lineare Regression angewendet wird, ist es außerdem erforderlich, dass die zwei vorausgehend und die zwei nachfolgend gemessenen Energiewerte X(n) die folgenden beiden Bedingungen erfüllen: X (n – 2) < X (n – 1) und X (n + 1) > X (n + 2).
  • Unter der Voraussetzung, dass einige Perkussionsinstrumente im Musiksignal Transienten mit Faktoren von 2 oder 4 des tatsächlichen BPM-Werts erzeugen können, wird im vorliegenden Beispielsfall das minimale Zeitintervall mit 90 ms gewählt. Sämtliche lokalen Maximal, die in einem Zeitintervall von 90 ms ausgehend vom vorausgehend ermittelten Transienten auftreten, werden deshalb ignoriert (Schritt S 103: Counter > tmin).
  • An den Schritt S 103 schließt sich der Schritt S 104 an, in welchem eine lineare Regression ausgeführt wird, die in 5 beispielhaft in Diagrammform dargestellt ist und nunmehr näher erläutert wird.
  • Da das Vorliegen lokaler Maxima nur in Zeitintervallen der Länge ts abgetastet wird, ist offensichtlich, dass die Lage eines lokalen Maximums lediglich mit einer Präzision von +/–0,5 × ts ermittelt werden kann, weil der Zeitzähler ebenfalls in Schritten von ts implementiert wird. Um eine präzisere Lokalisierung des lokalen Maximums zu erzielen, wird deshalb eine Vierpunkt-Linearregression berechnet, unter Verwendung der zwei vorausgehend und der zwei nachfolgend gemessenen Energiewerte Xn, wie in 5 gezeigt.
  • Wie aus 1 hervorgeht, folgt auf die Transienten-Erfassungseinrichtung 17 ein Zeitmesseinrichtung 21.
  • In der Zeitmesseinrichtung 21 wird ein berechneter Zeitwert Δt zu dem Wert des Zeitzählers addiert. Der resultierende Wert wird zu der Periodizitätsermittlungseinrichtung 13 weitergeleitet, der Funktion nunmehr näher erläutert wird.
  • In 6 ist die Funktion der Periodizitätsermittlungseinrichtung 21a in Flussdiagrammform gezeigt. Demnach wird im Schritt S 200 das gemessene Zeitintervall tP zunächst in einen Rhythmuseinheit- bzw. BPM-Wert überführt. Unter der Annahme, dass das gemessene Zeitintervall aus einer Rhythmuseinheit resultieren könnte, bei dem es sich um ein Mehrfaches von 1/2, 1/4 oder 2 handelt, wird der tatsächliche BPM-Wert des untersuchten Musikstücks auf die Grundrhythmuseinheit zurückgeführt, da in der vorliegenden Ausführungsform die erfindungsgemäße Vorrichtung nur dazu verwendet wird, BPM-Werte im Bereich von 60 bis 160 BPM zu ermitteln, wird deshalb angenommen, dass es sich bei BPM-Werten unter oder über diesem Bereich um mögliche Vielfache des tatsächlichen BPM-Werts handelt. Aus diesem Grund wird der aktuelle Werte BPMnew mit dem Faktor 2, 4 oder 0,5 skaliert, um diesen Faktor auf den Grundfaktor rückzuführen (Schritt S 201a, Schritt S 202a und Schritt S 203a).
  • Als nächstes wird der mittlere BPMavr-Wert der vorausgehend gemessenen BPM-Werte durch dividieren des BPM-Akkumulatorwerts "SUM" mit der Anzahl von akkumulierten BPM-Werten (NUMBER) dividiert und mit dem neuen gemessenen BPMnew-Wert verglichen. Wenn die Differenz innerhalb einer Grenze von ΔBPMmax liegt, wird BPMnew zu "SUM" addiert und "NUMBER" wird um 1 inkrementiert. Wenn außerdem "NUMBER" größer oder gleich ist wie 3, wird eine Fehlerflagge "FAIL" gelöscht und ein neuer BPMavr-Wert wird berechnet und an den Ausgang der Periodizitätsermittlungseinrichtung 13 weitergeleitet. Wenn hingegen die Differenz zwischen BPMnew und BPMavr größer ist als ΔBPMmax, wird die neue Messung als fehlerhaft angesehen. Wenn die Fehlerflagge "FAIL" bereits vorausgehend gesetzt war, werden "SUM" und "NUMBER" mit "0" "reinitialisiert". Anderweitig wird die Fehlerflagge "FAIL" gesetzt.
  • Das Ausgangssignal der Periodizitätsermittlungseinrichtung 21a wird an die Logikschaltung 15 weitergeleitet, an deren übrigen Eingänge die Ausgangssignale der Periodizitätsermittlungseinrichtungen der weiteren BPM-Detektoren 13, 14, ... n angelegt sind. Die Funktionsweise der Logikschaltung 15 ist in 6 in Form eines Flussdiagramms dargestellt.
  • Demnach wird immer dann, wenn eine neue Rhythmuseinheit bzw. BPM-Wert gemessen und in die Periodizitätsermittlungseinrichtung 21a eingespeist wird, durch einen Rhythmuseinheit-Zähler der glaubwürdigste gemessene BPM-Wert ermittelt. Für sämtliche n BPM-Detektoren 13, 14, ... n wird der BPMavr-Wert desjenigen BPM-Detektors mit dem höchsten "NUMBER"-Wert gewählt und an dem Ausgang der Logikschaltung 15 weitergeleitet und auf einer Anzeigeeinrichtung optisch dargestellt, wenn zumindest drei kontinuierliche Rhythmuseinheiten ermittelt wurden.

Claims (15)

  1. Verfahren zum Ermitteln von Rhythmuseinheiten (BPM) in ein Musikstück bildenden Audiodaten, bei dem die Audiodaten auf mehrere Ermittlungspfade aufgeteilt werden, in denen sie in vorbestimmte Frequenzbänder unterteilt werden, dadurch gekennzeichnet, dass die Audiodaten in den Ermittlungspfaden zur Ermittlung von Einschwingereignissen auf Transienten untersucht werden, wobei die Zeitintervalle zwischen zwei aufeinanderfolgenden Einschwingereignissen erfasst werden, wobei die Zeitintervalle gemittelt und als frequenz-bandspezifische Rhythmuseinheit (BPM) der Audiodaten in dem jeweiligen Ermittlungspfad definiert werden, und wobei aus den frequenzbandspezifischen Rhythmuseinheiten (BPM) der Ermittlungspfade diejenige Rhythmuseinheit ausgewählt wird, die die höchste Schlagzahl aufweist.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die ermittelte Rhythmuseinheit optisch angezeigt wird.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Frequenzbänder sehr schmalbandig gewählt werden.
  4. Verfahren nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, dass die Frequenzbänder im sehr hohen und/oder im sehr niedrigen Audiofrequenzspektrum gewählt werden.
  5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass zur Erfassung der Transienten die maximale mittlere Energie des Audiosignals im Frequenzband des jeweiligen Ermittlungspfads als Funktion der Zeit tw ermittelt wird.
  6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass die Amplitude des Audiosignals zur Ermittlung seiner Energie im Frequenzband des jeweiligen Ermittlungspfads in einem Zeitfenster vorgegebener Länge ins Quadrat erhoben und gemittelt wird.
  7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dadurch gekennzeichnet, dass das Zeitfenster ein rechteckiges Integrationsfenster ist.
  8. Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, dass die ins Quadrat erhobene Amplitude des Audiosignals durch ein Verzögerungselement verzögert, vom Eingangssignal der Verzögerungsleitung subtrahiert und unter Verwendung eines weiteren Verzögerungselements akkumuliert wird.
  9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass aufeinanderfolgende Zeitfenster von aufeinanderfolgenden Energieermittlungswerten durch Skalieren mit einem konstanten Faktor c und Ausgeben mit konstanten Zeitintervallen ts, wobei ts < tw, zur Überlappung gebracht werden.
  10. Verfahren nach einem der Anspruche 6 bis 9, dadurch gekennzeichnet, dass aus den ermittelten Energiewerten ein lokales Maximum bestimmt wird, auf das zur Ermittlung der maximalen mittleren Energie des Audiosignals eine lineare Regression angewendet wird.
  11. Verfahren nach Anspruch 10, dadurch gekennzeichnet, dass das lokale Maximum als derjenige Energiewert bestimmt wird, der größer als eine festgelegte Anzahl vorausgehender und eine festgelegte Anzahl nachfolgender Energiewerte ist.
  12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, dass als Kriterium für das lokale Maximum der bestimmte Energiewert außerdem größer als ein minimaler Energiepegel oder ein separat ermittelter Schwellenwert sein muss.
  13. Verfahren nach einem der Ansprüche 1 bis 12, dadurch gekennzeichnet, dass die ermittelte Rhythmuseinheit durch Skalieren auf eine Grundrhythmuseinheit rückgeführt wird, um sicherzustellen, dass sie kein Mehrfaches einer Grundrhythmuseinheit darstellt.
  14. Vorrichtung zum Ermitteln von Rhythmuseinheiten (BPM) in digitalen Audiodaten zur Durchführung des Verfahrens nach einem der Anspruche 1 bis 13, mit einem von den Audiodaten beaufschlagten Eingang (10) und einem Ausgang (11), an welchem die ermittelte Rhythmuseinheit (BPM) ausgegeben wird, gekennzeichnet durch mehrere Rhythmuseinheit-Detektoren (13, 14, ..., n) die parallel zwischen den Eingang (10) und eine Logikschaltung (15) vor dem Ausgang (11) geschaltet sind, wobei die Detektoren (13, 14, ..., n) jeweils folgende Bestandteile umfassen: a) einen Bandpassfilter (16) zum Abtrennen eines Frequenzbereichs von dem am Eingang anliegenden Audiosignal, wobei die Bandpassfilter (16) der Rhythmuseinheit-Detektoren (13, 14, ..., n) einen Teil der gesamten Bandbreite des Audiosignals abdecken, b) eine Transienten-Erfassungseinrichtung (17) zur Ermittlung von Einschwingereignissen, c) eine Zeiterfassungseinrichtung (21) zum Erfassen der Zeitintervalle zwischen zwei aufeinanderfolgenden Einschwingereignissen, d) eine Periodizitätsermittlungseinrichtung (21a) zum Mitteln der Zeitintervalle und Definieren der gemittelten Zeitintervalle als frequenzbandspezifische Rhythmuseinheit (BPM) der Audiodaten in dem jeweiligen Ermittlungspfad (13, 14, ..., n), wobei die Logikschaltung (15) dazu ausgelegt ist, aus den frequenzbandspezifischen Rhythmuseinheiten (BPM) der Ermittlungspfade (13, 14, ..., n) diejenigen Rhythmuseinheit (BPM) auszuwählen, die die höchste Schlagzahl aufweist.
  15. Vorrichtung nach Anspruch 14, gekennzeichnet durch eine der Logikschaltung (15) nachgeschaltete Anzeigeeinrichtung zur Anzeige der ermittelten Rhythmuseinheit.
DE10223735A 2002-05-28 2002-05-28 Verfahren und Vorrichtung zum Ermitteln von Rhythmuseinheiten in einem Musikstück Expired - Fee Related DE10223735B4 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE10223735A DE10223735B4 (de) 2002-05-28 2002-05-28 Verfahren und Vorrichtung zum Ermitteln von Rhythmuseinheiten in einem Musikstück
US10/202,328 US6812394B2 (en) 2002-05-28 2002-07-24 Method and device for determining rhythm units in a musical piece

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10223735A DE10223735B4 (de) 2002-05-28 2002-05-28 Verfahren und Vorrichtung zum Ermitteln von Rhythmuseinheiten in einem Musikstück

Publications (2)

Publication Number Publication Date
DE10223735A1 DE10223735A1 (de) 2004-01-08
DE10223735B4 true DE10223735B4 (de) 2005-05-25

Family

ID=29557360

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10223735A Expired - Fee Related DE10223735B4 (de) 2002-05-28 2002-05-28 Verfahren und Vorrichtung zum Ermitteln von Rhythmuseinheiten in einem Musikstück

Country Status (2)

Country Link
US (1) US6812394B2 (de)
DE (1) DE10223735B4 (de)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7353169B1 (en) * 2003-06-24 2008-04-01 Creative Technology Ltd. Transient detection and modification in audio signals
US7148415B2 (en) * 2004-03-19 2006-12-12 Apple Computer, Inc. Method and apparatus for evaluating and correcting rhythm in audio data
JP2005292207A (ja) * 2004-03-31 2005-10-20 Ulead Systems Inc 音楽分析の方法
US7563971B2 (en) * 2004-06-02 2009-07-21 Stmicroelectronics Asia Pacific Pte. Ltd. Energy-based audio pattern recognition with weighting of energy matches
US7626110B2 (en) * 2004-06-02 2009-12-01 Stmicroelectronics Asia Pacific Pte. Ltd. Energy-based audio pattern recognition
JP2006171133A (ja) * 2004-12-14 2006-06-29 Sony Corp 楽曲データ再構成装置、楽曲データ再構成方法、音楽コンテンツ再生装置および音楽コンテンツ再生方法
US20070189544A1 (en) 2005-01-15 2007-08-16 Outland Research, Llc Ambient sound responsive media player
US7603414B2 (en) * 2005-09-09 2009-10-13 Outland Research, Llc System, method and computer program product for collaborative background music among portable communication devices
EP1725009B1 (de) * 2005-05-12 2009-10-21 IPG Electronics 504 Limited Verfahren zur Synchronisierung von mindestens einem Multimediaperipheriegerät eines portablen Kommunikationsgeräts mit einer Audiodatei und dazugehöriges portables Kommunikationsgerät
US7518053B1 (en) * 2005-09-01 2009-04-14 Texas Instruments Incorporated Beat matching for portable audio
US8176101B2 (en) 2006-02-07 2012-05-08 Google Inc. Collaborative rejection of media for physical establishments
US7917148B2 (en) 2005-09-23 2011-03-29 Outland Research, Llc Social musical media rating system and method for localized establishments
US7645929B2 (en) * 2006-09-11 2010-01-12 Hewlett-Packard Development Company, L.P. Computational music-tempo estimation
US7777122B2 (en) * 2008-06-16 2010-08-17 Tobias Hurwitz Musical note speedometer
JP4816699B2 (ja) 2008-09-03 2011-11-16 ソニー株式会社 楽曲処理方法、楽曲処理装置、及びプログラム
US8507781B2 (en) * 2009-06-11 2013-08-13 Harman International Industries Canada Limited Rhythm recognition from an audio signal
US9245428B2 (en) 2012-08-02 2016-01-26 Immersion Corporation Systems and methods for haptic remote control gaming
US8952233B1 (en) * 2012-08-16 2015-02-10 Simon B. Johnson System for calculating the tempo of music
CN110890083B (zh) * 2019-10-31 2022-09-02 北京达佳互联信息技术有限公司 音频数据的处理方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04336599A (ja) * 1991-05-13 1992-11-24 Casio Comput Co Ltd テンポ検出装置
DE10123281C1 (de) * 2001-05-14 2002-10-10 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Analysieren eines Audiosignals hinsichtlich von Rhythmusinformationen des Audiosignals unter Verwendung einer Autokorrelationsfunktion

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5614687A (en) * 1995-02-20 1997-03-25 Pioneer Electronic Corporation Apparatus for detecting the number of beats
US6323412B1 (en) * 2000-08-03 2001-11-27 Mediadome, Inc. Method and apparatus for real time tempo detection

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04336599A (ja) * 1991-05-13 1992-11-24 Casio Comput Co Ltd テンポ検出装置
DE10123281C1 (de) * 2001-05-14 2002-10-10 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Analysieren eines Audiosignals hinsichtlich von Rhythmusinformationen des Audiosignals unter Verwendung einer Autokorrelationsfunktion

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
E.D. Scheirer,"Pulse Tracking with a Pitch Tracker ",Workshop on Applications of Signal Processing to Audio and Acoustics, 1997.
E.D. Scheirer,"Pulse Tracking with a Pitch Tracker",Workshop on Applications of Signal Processing to Audio and Acoustics, 1997. *
E.D. Scheirer,"Tempo and beat analysis of acoustic musical signals", J. Acoustical Soc. Am. 103(1), Jan. 1998, S.588-601 *
T. Tolonen, M. Karjalainen,"A Computionally Effi- cient Multipitch Analysis Model" IEEE Transactions on Speed and Audio Processing, Vol.8, No.6, Nov. 2000, S.708-716 *

Also Published As

Publication number Publication date
US20030221544A1 (en) 2003-12-04
US6812394B2 (en) 2004-11-02
DE10223735A1 (de) 2004-01-08

Similar Documents

Publication Publication Date Title
DE10223735B4 (de) Verfahren und Vorrichtung zum Ermitteln von Rhythmuseinheiten in einem Musikstück
EP1371055B1 (de) Vorrichtung zum analysieren eines audiosignals hinsichtlich von rhythmusinformationen des audiosignals unter verwendung einer autokorrelationsfunktion
DE3306730C2 (de)
DE3327139C2 (de) Verfahren und Vorrichtung von für die Rekonstruktion einer Wellenform vorgesehenen Daten
EP0296588B1 (de) Verfahren und Schaltungsanordnung zum automatischen Wiedererkennen von Signalfolgen
DE3101851C2 (de) Vorrichtung zum Erkennen von Sprache
EP1388145B1 (de) Vorrichtung und verfahren zum analysieren eines audiosignals hinsichtlich von rhythmusinformationen
DE60028684T2 (de) Verfahren und Anordnung zur Bestimmung der Anzahl von Teilentladungsquellen
EP1745464A1 (de) Vorrichtung und verfahren zum analysieren eines informationssignals
DE3233637A1 (de) Vorrichtung zur bestimmung der dauer von sprach- oder tonsignalen
DE3012771C2 (de)
WO1998023130A1 (de) Gehörangepasste qualitätsbeurteilung von audiosignalen
DE2816332A1 (de) System zum identifizieren einer bewegten schallquelle
EP3942307A1 (de) Vorrichtung zur analyse von strömen in einem elektrischen verbraucher und verbraucher mit einer derartigen vorrichtung
EP0593007A2 (de) Verfahren zum Bestimmen der elektrischen Netzableitung in ungeerdeten elektrischen Netzen
EP0777326B1 (de) Verfahren und Vorrichtung zur Filterung eines Audiosignals
EP1755110A2 (de) Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
EP1382034B1 (de) Verfahren zur bestimmung von intensitätskennwerten von hintergrundgeräuschen in sprachpausen von sprachsignalen
DE2431458A1 (de) Verfahren zur automatischen sprechererkennung
DE2737812C3 (de) Verfahren zur Frequenzanalyse von transienten (einmaligen) Schallimpulsen
DE2334459C3 (de) Unterscheidung zwischen stimmhaften und stimmlosen Lauten bei der Sprachsignalauswertung
DE1547027B2 (de) Verfahren und anordnung zur konsonantenbestimmung in sprachsignalen
DE2717530A1 (de) Verfahren zur stoerbefreiung von signalen
DE1772633A1 (de) Verfahren zur Spracherkennung
DE1122274B (de) Verfahren und Anordnung zur automatischen Erkennung von Sprache

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
8328 Change in the person/name/address of the agent

Representative=s name: HOFSTETTER, SCHURACK & SKORA, 81541 MUENCHEN

R081 Change of applicant/patentee

Owner name: MUSIC GROUP IP LTD., VG

Free format text: FORMER OWNER: RED CHIP COMPANY LTD., TORTOLA, VG

R082 Change of representative

Representative=s name: HOFSTETTER, SCHURACK & PARTNER PATENT- UND REC, DE

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee