DE69738476T2 - Verfahren und Gerät für Anrufregistrierung in einem Speicher - Google Patents

Verfahren und Gerät für Anrufregistrierung in einem Speicher Download PDF

Info

Publication number
DE69738476T2
DE69738476T2 DE69738476T DE69738476T DE69738476T2 DE 69738476 T2 DE69738476 T2 DE 69738476T2 DE 69738476 T DE69738476 T DE 69738476T DE 69738476 T DE69738476 T DE 69738476T DE 69738476 T2 DE69738476 T2 DE 69738476T2
Authority
DE
Germany
Prior art keywords
signal
samples
speech
sample
recorded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69738476T
Other languages
English (en)
Other versions
DE69738476D1 (de
Inventor
Tero Haataja
Ari Sinisalo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of DE69738476D1 publication Critical patent/DE69738476D1/de
Application granted granted Critical
Publication of DE69738476T2 publication Critical patent/DE69738476T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • H04M1/65Recording arrangements for recording a message from the calling party
    • H04M1/656Recording arrangements for recording a message from the calling party for recording conversations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42221Conversation recording systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Description

  • Die Erfindung bezieht sich auf ein Verfahren, mittels dessen ein Gespräch in komprimierter Form auf einem Speicherelement aufgezeichnet werden kann, und auch auf ein System, um so ein Verfahren zu verwirklichen.
  • Es ist bekannt, einen getrenntes Bandaufzeichnungsgerät oder dergleichen mit einem Telefonapparat zu verbinden und ein Gespräch auf diesem Gerät aufzuzeichnen. Ein solches Verfahren ist ziemlich unhandlich, wenn es auf mobile Kommunikationsvorrichtungen angewandt wird, da zusätzlich zu einem Bandaufzeichnungsgerät auch ein Mischer benötigt wird, der die ankommenden und nach außen gehenden Audiosignale in ein Audiosignal kombiniert, damit dieses vom Bandaufzeichnungsgerät aufgezeichnet werden kann. Weiterhin müssen in einem digitalen mobilen Kommunikationssystem, wie dem GSM-System, die Audiosignale von einem digitalen in ein analoges Format vor dem Aufzeichnen umgewandelt werden, was somit den Rauschpegel des aufzuzeichnenden Audiosignals erhöht. Ein solches Verfahren für die Aufzeichnung erfordert mehrere getrennte Geräte, was teuer und unpraktisch ist.
  • Es ist bekannt, den Ton einer Rufrichtung zu einer Zeit in einem digitalen Format im Speicher einer mobilen Kommunikationsvorrichtung aufzuzeichnen. Ein solches System ist im finnischen Patentdokument Nr. 91457 und dem entsprechenden britischen Patentdokument GB 2 254 986 offenbart. Das in Frage stehende Patentdokument offenbart ein Verfahren für das Aufzeichnen von Sprache ohne Pausen. In dem Verfahren wird die Sprache zuerst durch einen A/D-Wandler in ein digitales Format umgewandelt und in Rahmen kodiert. Die Rahmen, die Sprache enthalten, werden im Speicher aufgezeichnet, bis ein Sprachaktivitätsdetektor eine Pause in der Sprache detektiert. Eine Pausestartmarkierung und die Länge der Pause werden im Speicher aufgezeichnet, bevor der nächste Sprachrahmen aufgezeichnet wird. Mittels eines solchen Verfahrens kann Sprache sehr effizient aufgezeichnet werden, da das Audiosignal während Pausen nicht aufgezeichnet wird. Während der Sprachwiedergabe werden die aufgezeichneten Rahmen zu Wiedergabemitteln gesandt, und wenn man auf eine Pausenmarkierung trifft, wartet das System während einer Zeitdauer, die der aufgezeichneten Pausenlängeninformation entspricht, bevor es die nächsten Rahmen sendet. Das in diesem Patentdokument offenbarte Verfahren hat den Nachteil, dass es zu einer Zeit nur den Ton einer Audioquelle, beispielsweise die Antwortnachricht eines automatischen Telefonanrufbeantworters, aufzeichnen kann.
  • Die Patentveröffentlichung EPA-0725 499 beschreibt einen Sende-Empfänger, in welchem eingegebene Audiosignale komprimiert und durch einen Sprachkodierer kodiert werden, aber sie offenbart nur Merkmale gemäß den Oberbegriffen der unabhängigen Ansprüche.
  • Eine Aufgabe der Erfindung besteht darin, ein Verfahren für das Aufzeichnen der Sprache beider Parteien eines Gesprächs auf einem Speichermittel zu liefern. Eine andere Aufgabe der Erfindung besteht darin, ein Verfahren für das Aufzeichnen der Sprache beider Parteien eines Gesprächs auf einem Speichermedium in einer effizienten Weise zu liefern, um somit Kapazität des Speichermediums zu sparen. Eine weitere Aufgabe der Erfindung besteht darin, ein Verfahren zu liefern, das nur wenig Rechenkapazität erfordert, um die obigen Aufgaben zu verwirklichen.
  • Die Aufgaben werden gelöst durch das Aufzeichnen der Rahmen, die aus einem Audiosignal gebildet wurden, nur dann wenn der Sprachaktivitätsdetektor, wobei es von diesem einen oder mehrere geben kann, Sprache detektiert, und durch das Kombinieren der Rahmen, die aus den Signalen von zwei oder mehr Quellen gebildet sind, und das Aufzeichnen der Rahmen, die das kombinierte Signal darstellen, wenn der eine oder die mehreren Sprachaktivitätsdetektoren Sprache detektieren.
  • Das Verfahren gemäß der Erfindung ist gekennzeichnet durch das, was im kennzeichnen Teil des unabhängigen Verfahrensanspruchs spezifiziert ist. Die Erfindung ist weiter auf ein System gerichtet, das durch das gekennzeichnet ist, was im kennzeichnenden Teil des unabhängigen Systemanspruchs spezifiziert ist. Abhängige Ansprüche beschreiben weitere vorteilhafte Ausführungsformen der Erfindung.
  • Im System gemäß der Erfindung werden die Audiosignalabtastungen nur aufgezeichnet, wenn Sprache in den Audiosignalen detektiert wird. Das System gemäß der Erfindung spart Speicherkapazität, die für das Aufzeichnen erforderlich ist, durch das Kombinieren der Audiosignalabtastungen, wenn Sprache in den Abtastungen von mindestens einem Audiosignal detektiert wird. Die Erfindung erniedrigt auch die erforderliche mittlere Rechenkapazität und somit auch den Leistungsverbrauch, da die Signalkombination oder das Mischen vorteilhafterweise nur ausgeführt wird, wenn Sprache in Abtastungen von mehr als einem Audiosignal detektiert wird.
  • Die Erfindung wird detaillierter unter Bezug auf die bevorzugten Ausführungsformen, die nur beispielhaft präsentiert werden, und unter Bezug auf die angefügten Zeichnungen beschrieben.
  • 1 zeigt ein Flussdiagramm des Betriebs des Systems gemäß der Erfindung;
  • 2 zeigt ein Blockdiagramm einer bevorzugten Ausführungsform der Erfindung; und
  • 3 zeigt ein Zustandsdiagramm des Betriebs einer bevorzugten Ausführungsform der Erfindung.
  • Im Verfahren gemäß einer bevorzugten Ausführungsform der Erfindung wird das Audiosignal in Abtastungen einer gewissen Länge aufzeichnet. Die aufzuzeichnenden Abtastungen werden gemäß den Ausgaben der Sprachaktivitätsdetektoren für die gesendeten und empfangenen Audiosignale ausgebildet. Wenn Sprache sowohl im empfangenen als auch gesendeten Signal detektiert wird, wird die Abtastung als ein Kombination dieser Signale, beispielsweise durch eine Summation, ausgebildet. Wenn Sprache nur in einem Signal detektiert wird, wird die Abtastung vorzugsweise nur aus diesem Signal gebildet. Alternativ können die Abtastungen in diesem Fall ebenfalls kombiniert werden, und die Abtastung des stillen Signals kann vorteilhafterweise durch eine Nullabtastung ersetzt werden, das ist eine Abtastungen, die eine oder mehrere Nullen oder andere Werte, die Ruhe entsprechen, enthält. Wenn keine Sprache in keinem der Signale detektiert wird, wird keines der Signale aufgezeichnet. Dann wird ein Ruheperiodenstartmarkierung im Speichermittel aufgezeichnet, und die Länge der Ruheperiode wird gemessen, und wenn die Ruhe endet, wird die Ruhelängeninformation aufgezeichnet.
  • In dieser Patentanmeldung bedeutet "Sprache" zusätzlich zur normalen Definition von Sprache auch alle Arten von Tönen, die möglicherweise im Audiosignal erscheinen, mit Ausnahme des Hintergrundrauschens.
  • 1 zeigt ein Flussdiagramm des Betriebs einer Ausführungsform des Systems gemäß dieser Erfindung. Dieses Beispiel zeigt das Aufzeichnen eines normalen Gespräches zwischen zwei Parteien. Ein Benutzer startet, 100, die Gesprächsaufzeichnung, beispielsweise durch das Drücken einer Taste des Mobiltelefons oder durch das Ausgeben des Aufzeichnungsstartbefehls in einer anderen bekannten Art. Als nächstes erhält das System, 101, eine Abtastung des ankommenden Audiosignals und des abgehenden Audiosignals, das vom Benutzer gesprochen wird. Dann prüft, 102, das System, ob der Benutzer einen Aufzeichnungsstopbefehl ausgegeben hat, beispielsweise durch das Drücken einer gewissen Taste oder auf eine andere bekannte Weise. Typischerweise ist das am Beginn der Aufzeichnung nicht der Fall, so dass das System als nächstes die Werte der Ausgaben der Sprachaktivitätsdetektoren beider Audiosignale prüft, 103. Wenn beide Detektoren anzeigen, dass die Signale Sprache enthalten, erzeugt, 110, das System die Abtastung, die an das Speicherelement zu senden ist, auf der Basis sowohl der Abtastung des empfangenen ankommenden Audiosignals als auch der Abtastung des abgehenden Audiosignals, das durch den Benutzer gesprochen wird. Im Verfahren gemäß der Erfindung ist es möglich, jedes Verfahren aus dem Stand der Technik zu verwenden, um zwei Signalabtastungen zu kombinieren, und die Erfindung ist nicht auf die Verwendung irgend eines speziellen Kombinationsverfahrens begrenzt. Die so erzeugte Abtastung wird kodiert, 113, um den erforderlichen Aufzeichnungsspeicher zu vermindern und an das Speicherelement gesandt, 115, wonach die Ausführung zum Schritt 101 zurückkehrt. Das Verfahren gemäß der Erfindung kann vorteilhafterweise eine A-law-Kodierung verwenden. Die Erfindung ist jedoch nicht auf die Verwendung einer A-law-Kodierung begrenzt, sondern das Verfahren und das System gemäß der Erfindung können auch andere Kodier- und Komprimierungsverfahren gemäß dem Stand der Technik verwenden, wie Verfahren, die im GSM-System verwendet werden. Die Kodierverfahren, die im GSM-System verwendet werden, und die GSM-Systemarchitektur werden beispielsweise beschrieben in "The GSM System for Mobile Communications" von Michel Mouly und Marie-Bernadette Pautet, veröffentlicht von den Autoren, ISBN 2-9507190-0-7, Palaiseau 1992, 701 pp.
  • Wenn im Schritt 103 von beiden Detektoren Sprache nicht detektiert wurde, prüft, 104, das System als nächstes, ob der Sprachaktivitätsdetektor des ankommenden Audiosignals Sprache detektiert. Wenn Sprache im ankommenden Signal detektiert wird, wird die Abtastung des ankommenden Audiosignals als die aufzuzeichnende Abtastung festgelegt, 111. Die aufzuzeichnende Abtastung wird in einem A-law-Kodierer kodiert, 113 und an das Speicherelement gesandt, 115, wonach die Ausführung zum Schritt 101 zurückkehrt.
  • Wenn im Schritt 104 der Sprachaktivitätsdetektor des ankommenden Audiosignals keine Sprache detektiert, prüft, 105, das System als nächstes, ob der Sprachaktivitätsdetektor des abgehenden Audiosignals Sprache detektiert. Wenn Sprache im abgehenden Signal detektiert wird, wird die abgehende Sprachabtastung als die aufzuzeichnende Abtastung festgelegt, 111. Die aufzuzeichnende Abtastung wird in einem A-law-Kodierer kodiert, 113, und an das Speicherelement gesandt, 115, wonach die Ausführung zum Schritt 101 zurückkehrt.
  • Wenn im Schritt 105 der Sprachaktivitätsdetektor des abgehenden Audiosignals keine Sprache detektiert, wird eine Ruhestartmarkierung an das Speicherelement gesandt, 106. Als nächstes erhält, 107, das System eine Abtastung des ankommenden Audiosignals und des abgehenden Audiosignals, das vom Benutzer gesprochen wird, und erhöht, 116 den Wert des Zählers, der die Länge der Ruhe misst, um eins. Wenn keine Sprache in den im Schritt 107 geholten Abtastungen detektiert wird, kehrt das System zum Schritt 107 zurück und holt die nächsten Abtastungen. Die Schritte 107, 116 und 108 werden wiederholt, bis Sprache in der Abtastung von mindestens einem Audiosignal detektiert wird, wonach das System die Länge der Ruhe im Speicherelement aufzeichnet, 109, den Zähler, der die Länge der Ruhe misst, zurücksetzt (aus Gründen der Klarheit ist dieser Schritt in 1 nicht gezeigt) und zu Schritt 102 zurückkehrt.
  • Die oben beschriebene Sequenz wird wiederholt, bis der Benutzer den Aufzeichnungsstopbefehl ausgibt, der Speicher, der für die Aufzeichnung reserviert ist, ausgeht, das Gespräch gelöst wird, die Verbindung unterbrochen wird oder beispielsweise eine vorbestimmte Zeitgrenze, die für die Aufzeichnung festgelegt ist, erreicht wird.
  • Im vorigen Beispiel wird die Aufzeichnung beendet, wenn die Verbindung aus irgend einem Grund unterbrochen wird, oder wenn der andere Teilnehmer oder der Benutzer die Gesprächsverbindung beendet. Dies soll jedoch keine Begrenzung der Erfindung darstellen. In einer anderen vorteilhaften Ausführungsform der Erfindung wird das Aufzeichnen nach einem solchen Ereignis fortgesetzt, bis der Benutzer die Aufzeichnung beendet, beispielsweise indem er einen entsprechenden Befehl über die Benutzerschnittstelle, beispielsweise ein Tastenfeld, eines mobilen Kommunikationsmittels gibt. In dieser Ausführungsform beeinflusst die unterbrochene oder gelöste Verbindung vorzugsweise die Aufzeichnung in einer ähnliche Weise wie ein Schweigen der anderen Partei. Beispielsweise wird nur das Sprachsignal des Benutzers aufgezeichnet, oder das Sprachsignal des Benutzers wird mit einem Signal gemischt, das Ruhe entspricht. Diese Ausführungsform hat den Vorteil, dass der Benutzer abschließende Kommentare der Aufzeichnung hinzufügen kann, nachdem die Verbindung unterbrochen oder gelöst wurde.
  • Vorteilhafterweise prüft das System in Schritt 116, dass der Zählerwert eine gewisse Grenze nicht übersteigt, die von der Implementierung der Ausführungsform abhängt. Beispielsweise wird in mobilen GSM-Stationen das Audiosignal durch 13 Bit dargestellt, so dass nach der A-law-Kodierung im Schritt 113 die kodierte Abtastung, die im Speicherelement aufzuzeichnen ist, durch 8 Bits dargestellt werden kann, was eine vorteilhafte Länge für ein Speicherelementwort darstellt. Dann ist auch der Zähler für die Länge der Ruhe vorteilhafterweise ein 8-Bit Element, wobei er in diesem Fall maximal 255 Ruheabtastungen zählen kann. Wenn der Zähler den Maximalwert erreicht, kann das System beispielsweise an das Speicherelement den Maximalwert des Zählers senden, und eine neue Ruhestartmarkierung und den Zähler zurücksetzen, um das Zählen vom Beginn zu starten.
  • Es ist möglich im Schritt 113 statt der A-law-Kodierung ein anderes bekanntes Signalkomprimierungsverfahren, wie eine μ-law-Kodierung, eine adaptive differentielle Pulskodemodulation (ADPCM) oder eine GSM FR Kodierung zu verwenden. Das im Schritt 113 verwendete Kodierelement kann beispielsweise ein Kodierelement sein, das man in der Mobilstation findet, das verwendet wird, um das Audiosignal, das zum Funkpfad gesendet wird, zu kodieren, oder ein getrenntes Kodierelement, das speziell für die Aufzeichnung konstruiert ist.
  • 2 zeigt ein Blockdiagramm einer bevorzugten Ausführungsform der Erfindung, die beispielsweise in GSM-Mobilstationen verwendet werden kann. Ein Empfängerteil 200 empfängt eine ankommende Übertragung und wandelt das Audiosignal, das in den Rahmen des GSM-Basisstationssignals enthalten ist, in digitale 13-Bit-Abtastungen um, die zum Sprachaktivitätsdetektor 206 des ankommenden Audiosignals und zu einem digitalen Signalprozessor (DSP) 210 genommen werden. Die Sprache des Benutzers der Mobilstation, die in ein Mikrofon 202 gesprochen wird, wird in einem A/D-Wandler 204 in digitale Abtastungen umgewandelt, die zum Sprachaktivitätsdetektor 208 des abgehenden Audiosignals und zum digitalen Signalprozessor 210 genommen werden. Die Ausgaben der Detektoren 206, 208 sind funktional mit dem digitalen Signalprozessor 210 verbunden. Die Blöcke des in 1 gezeigten Flussdiagramms können vorteilhafterweise als Programme im digitalen Signalprozessor 210 verwirklicht werden. Der digitale Signalprozessor 210 erzeugt die aufzunehmenden Abtastungen aus den Abtastungen des ankommenden Audiosignals, aus den Abtastungen des abgehenden Audiosignals, oder aus beiden, und sendet die aufgezeichneten Abtastungen über einen A-law-Kodierer 214 an ein Speicherelement 212. Der digitale Signalprozessor 210 berechnet auch die Längen der Ruhepausen und sendet, 216, die Ruhepausenstartmarkierungen und die gemessenen Längen an das Speicherelement 212 ohne eine Kodierung im Kodierer 214. Aus Gründen der Klarheit zeigt 2 nur solche Teile eines mobilen Kommunikationsmittels, die notwendig sind, um die Ausführungsform zu illustrieren.
  • Im in 2 dargestellten Beispiel werden zwei ankommende Audiosignale durch zwei getrennte Sprachaktivitätsdetektoren 206, 208 überwacht. Es kann sein, dass es mehr als zwei Audiosignale gibt, die aufzuzeichnen sind. Zusätzlich kann ein Sprachaktivitätsdetektor oder ein äquivalentes Überwachungselement des Audiosignals festgesetzt werden, um mehr als ein Audiosignal zu überwachen. Solche Sprachaktivitätsdetektoren oder äquivalente Audiosignalüberwachungselemente können auch als Programme im digitalen Signalprozessor 210 verwirklicht werden. Andererseits kann das System statt dem gebräuchlichen digitalen Signalprozessor 210 ein spezielles Mischelement 210 umfassen, das mindestens von einem Audiosignalüberwachungselement gesteuert wird, das Audiosignalabtastungen mischt, wenn Sprache in mehr als einem Audiosignal detektiert wird, und das Abtastungen von nur einem Audiosignal an seine Ausgänge kopiert, wenn Sprache in den Abtastungen von dem nur einen Audiosignal detektiert wird. Die Wiedergabe des aufgezeichneten Gesprächs kann in ähnlicher Weise bewirkt werden. Während der Wiedergabe kann eine Sprachaktivitätsüberwachungseinrichtung eine Überwachung ausführen, ob der Benutzer der Mobilstation spricht oder dies nicht tut. Wenn der Benutzer spricht, wird das Sprachsignal mit dem Signal gemischt, das in einem Mischelement abgespielt wird. Wenn der Benutzer nicht spricht, kann das Mischelement das wiedergegebene Signal an seinen Ausgang kopieren oder das wiedergegebene Signal mit einem Nullsignal mischen, das ist ein Signal, das Nullwerte oder andere Werte, die Ruhe entsprechen, aufweist.
  • Die Wiedergabe eines aufgezeichneten Gesprächs kann beispielsweise auch so ausgelegt werden, das kodierte Audiosignalabtastungen aus dem Speicherelement 212 geholt werden, wobei zur selben Zeit beobachtet wird, ob es eine Ruhestartmarkierung unter den Abtastungen gibt. Die kodierten Audiosignalabtastungen werden in einem A-law-Dekodierer dekodiert, wonach die Abtastungen zum gewünschten Signaleingang, beispielsweise über einen A/D-Wandler zu einem Lautsprecher oder externen Verstärkersystem oder möglicherweise über den Senderteil der Mobilstation zum anderen Teilnehmer des Gesprächs, gegeben werden. Wenn eine Ruhestartmarkierung unter den Abtastungen detektiert wird, wird die Ruhelängeninformation aus dem Speicherelement gelesen, und das Lesen der Abtastungen aus dem Speicherelement 212 wird für die Dauer der Ruhe unterbrochen.
  • 3 zeigt ein Zustandsdiagramm des Betriebs einer bevorzugten Ausführungsform der Erfindung in einer Situation, wo die Sprachen der zwei Teilnehmer eines Gesprächs aufgezeichnet werden. Der Betrieb kann als eine Vierzustandsmaschine gemäß 3 dargestellt werden. Das Zustandsdiagramm der 3 kann beispielsweise verwendet werden, um den Betrieb der in 2 gezeigten Ausführungsform darzustellen. Die Zustände sind folgende:
    • 31 Der Benutzer der Mobilstation spricht zur Mobilstation
    • 32 Ruhe, beide Teilnehmer sind ruhig
    • 33 Der andere Teilnehmer spricht, und
    • 34 Beide Teilnehmer sprechen
  • Im Zustand 31, bei dem nur der Benutzer der Mobilstation spricht, werden Abtastungen der Sprache des Benutzers der Mobilstation im Speicherelement aufgezeichnet. Im Zustand 32 werden überhaupt keine Signalabtastungen aufgezeichnet, aber das System misst die Länge der Pause. Im Zustand 33 spricht der andere Teilnehmer, und Abtastungen der Sprache des anderen Teilnehmers werden im Speicherelement aufgezeichnet. Im Zustand 34 sprechen beide Parteien, und die Abtastungen der Audiosignale beider Parteien werden kombiniert, und die kombinierten Abtastungen werden im Speicherelement aufgezeichnet.
  • Der Übergang 301 tritt auf, wenn der Benutzer der Mobilstation mit dem Sprechen beginnt. Das System sieht dies als Aktivierung des Sprachaktivitätsdetektors, der die Sprache des Benutzers der Mobilstation überwacht. Das System zeichnet dann im Speicherelement die Länge der Ruhedauer auf.
  • Der Übergang 302 tritt auf, wenn der Benutzer der Mobilstation das Sprechen beendet. Das System sieht dies als Deaktivierung des Sprachaktivitätsdetektors, der die Sprache des Benutzers der Mobilstation überwacht. Das System zeichnet dann im Speicherelement die Ruhedauerstartmarkierung auf.
  • Der Übergang 303 tritt auf, wenn beide Teilnehmer des Gesprächs das Sprechen beenden. Das System sieht dies als Deaktivierung beider Sprachaktivitätsdetektoren. Das System zeichnet dann im Speicherelement die Ruhedauerstartmarkierung auf.
  • Der Übergang 304 tritt auf, wenn beide Teilnehmer mit dem Sprechen beginnen. Das System sieht dies als Aktivierung beider Sprachaktivitätsdetektoren. Das System zeichnet dann im Speicherelement die Länge der Ruhedauer auf.
  • Der Übergang 305 tritt auf, wenn der Benutzer der Mobilstation in einer Situation mit dem Sprechen aufhört, während der andere Teilnehmer spricht. Das System sieht dies als Deaktivierung des Sprachaktivitätsdetektors, der die Sprache des Benutzers der Mobilstation überwacht.
  • Der Übergang 306 tritt auf, wenn der Benutzer der Mobilstation mit dem Sprechen beginnt, wenn der andere Teilnehmer spricht. Das System sieht dies als Aktivierung des Sprachaktivitätsdetektors, der die Sprache des Benutzers der Mobilstation überwacht.
  • Der Übergang 307 tritt auf, wenn der andere Teilnehmer in einer Situation mit dem Sprechen beginnt, in der der Benutzer der Mobilstation spricht. Das System sieht dies als Aktivierung des Sprachaktivitätsdetektors, der die Sprache des anderen Teilnehmers überwacht.
  • Der Übergang 308 tritt auf, wenn der andere Teilnehmer in einer Situation mit dem Sprechen aufhört, bei der der Benutzer der Mobilstation spricht. Das System sieht dies als Deaktivierung des Sprachaktivitätsdetektors, der die Sprache des anderen Teilnehmers überwacht.
  • Der Übergang 309 tritt auf, wenn der anderen Teilnehmer das Sprechen beendet zur selben Zeit, zu der der Benutzer der Mobilstation mit dem Sprechen beginnt. Das System sieht dies als Deaktivierung des Sprachaktivitätsdetektors, der die Sprache des anderen Teilnehmers überwacht und als Aktivierung des Detektors, der die Sprache des Benutzers der Mobilstation überwacht.
  • Der Übergang 310 tritt auf, wenn der anderen Teilnehmer zur selben Zeit mit dem Sprechen beginnt, zu der der Benutzer der Mobilstation das Sprechen beendet. Das System sieht dies als Aktivierung des Sprachaktivitätsdetektors, der die Sprache des anderen Teilnehmers überwacht, und als Deaktivierung des Detektors, der die Sprache des Benutzers der Mobilstation überwacht.
  • Der Übergang 311 tritt auf, wenn der andere Teilnehmer mit dem Sprechen beginnt. Das System sieht dies als Aktivierung des Sprachaktivitätsdetektors, der die Sprache des anderen Teilnehmers überwacht. Das System zeichnet dann die Länge der Ruhedauer im Speicherelement auf.
  • Der Übergang 312 tritt auf, wenn der andere Teilnehmer das Sprechen beendet. Das System sieht dies als Deaktivierung des Sprachaktivitätsdetektors, der die Sprache des anderen Teilnehmers überwacht. Das System zeichnet dann die Ruhedauerstartmarkierung im Speicherelement auf.
  • Das Verfahren gemäß der Erfindung ist nicht auf das Aufzeichnen der Sprache von zwei Teilnehmern begrenzt, sondern das Verfahren gemäß der Erfindung kann auch für das Aufzeichnen eines sogenannten Konferenzgesprächs mit mehreren Teilnehmern verwendet werden. Das System gemäß der Erfindung kann verwendet werden, um mehr als zwei getrennte Audiosignale aufzuzeichnen, wobei in diesem Fall das System einen Sprachaktivitätsdetektor für jedes aufzuzeichnende Audiosignal umfasst, und wobei die aufzuzeichnende Abtastung in der oben beschriebenen Weise aus den Abtastungen des Audiosignals, in dem Sprache detektiert wird, erzeugt wird.
  • Im Verfahren gemäß der Erfindung werden das Signalmischen und die Rechenkapazität des digitalen Signalprozessors, die für das Mischen erforderlich ist, nur benötigt, wenn die Teilnehmer eines Gesprächs zur selben Zeit sprechen, was erforderliche Rechenkapazität und ebenso Leistung, die durch das System verbraucht wird, spart. Weiterhin muss ein getrennter analoger Mischer nicht zu den analogen Teilen der Mobilstation hinzugefügt werden, um ein Gespräch aufzuzeichnen.
  • Das System gemäß der Erfindung kann leicht aktuellen Mobilstationen hinzugefügt werden, da die meisten Funktionen des Systems als Programme im digitalen Signalprozessor, den man typischerweise in Mobilstationen findet, verwirklicht werden können. Einige Mobilstationsmodelle haben schon die Speicherkapazität, die vom System gemäß der Erfindung gefordert wird, und das Hinzufügen erforderlicher Speicherkapazität ist bei den aktuellen Preisen von Speicherbausteinen nicht teuer.
  • Es ist für einen Fachmann offensichtlich, dass die verschiedenen Ausführungsformen der Erfindung nicht auf die oben beschriebenen Beispiele beschränkt sind, sondern dass sie innerhalb des Umfangs der nachfolgenden Ansprüche modifiziert werden können.
  • In den hier angefügten Ansprüchen bezeichnet "Signal" das Ausgangssignal einer Audioquelle, das möglicherweise Ruhepausen, einfaches Hintergrundrauschen oder beispielsweise Sprache oder Musik einschließt. In den hier angefügten Ansprüchen bezeichnet "Sprache" zusätzlich zur normalen Definition von Sprache auch andere Töne im aufzunehmenden Signal, die sich vom Hintergrundrauschen unterscheiden, wie Musik und Töne von Maschinen, aber spezifisch kein Hintergrundrauschen.

Claims (10)

  1. Verfahren zum Aufzeichnen von mindestens zwei digitalen Signalen, welche Samples mit konstanter Dauer umfassen, die Informationsbits enthalten, wobei das Verfahren das Aufzeichnen von codierten Signalsamples durch ein Speicherelement (212) umfasst, welches funktional mit dem Ausgang eines Codierelements (214) verbunden ist, dadurch gekennzeichnet, dass das Verfahren Phasen umfasst, in denen – mindestens ein Teil der Signalsamples durch ein Mischelement für das Aufzeichnen (210) kombiniert werden, und – die Signalsamples, die von dem Ausgang des Mischelements (210) kommen, durch das Codierelement (214) codiert werden, welches funktional mit dem Ausgang des Mischelements (210) verbunden ist, um die Speicherkapazität zu verringern, die für das Aufzeichnen von Signalsamples erforderlich ist.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass, falls Sprache in einem Sample von nur einem Signal erfasst wird, das in dem Speicherelement aufgezeichnete Sample das Sample dieses Signals ist.
  3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass, falls Sprache in Samples von mehr als einem Signal erfasst wird, das in dem Speicherelement aufzuzeichnende Sample aus den Signalsamples gebildet wird, in denen Sprache erfasst wurde.
  4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass das in dem Speicherelement aufzuzeichnende Sample gebildet wird aus – mindestens einem Signalsample, in dem Sprache erfasst wird, und – mindestens einem Signalsample, in dem keine Sprache erfasst wird, so dass der Wert des mindestens einen Signalsamples, in dem keine Sprache erfasst wird, auf einen Wert gesetzt wird, der Stille entspricht, bevor die Signalsamples kombiniert werden, um das aufzuzeichnende Sample zu bilden.
  5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die aufzuzeichnenden Samples vor dem Aufzeichnen in dem Speicherelement codiert werden, um die erforderliche Speicherkapazität zu verringern.
  6. System zum Aufzeichnen von mindestens zwei digitalen Signalen, welche Samples konstanter Dauer umfassen, welche Informationsbits enthalten, wobei das System umfasst: – ein Speicherelement (212), welches funktional mit dem Ausgang eines Codierelements (214) verbunden ist, eingerichtet zum Aufzeichnen der codierten Signalsamples, dadurch gekennzeichnet, dass das System umfasst – ein Mischelement (210), welches so eingerichtet ist, dass es mindestens einen Teil der Signalsamples für die Aufzeichnung kombiniert, und – das Codierelement funktional mit dem Ausgang des Mischelements (210) verbunden ist, so eingerichtet, dass es die Signalsamples, die von dem Ausgang des Mischelements (210) kommen, codiert, um die Speicherkapazität zu verringern, die für das Aufzeichnen von Signalsamples erforderlich ist.
  7. System nach Anspruch 6, dadurch gekennzeichnet, dass das System auch mindestens ein Überwachungselement (206) umfasst, so eingerichtet, dass es mindestens eines der Signale überwacht, und dass das Mischelement (210) auch so eingerichtet ist, dass es Samples von nur einem Signal in seinen Ausgang kopiert, wenn das mindestens eine Überwachungselement (206) Sprache nur in den Samples des einen Signals erfasst.
  8. System nach Anspruch 6, dadurch gekennzeichnet, dass es auch mindestens ein Überwachungselement (206) umfasst, welches so eingerichtet ist, dass es mindestens eines der Signal überwacht, und dass das Mischelement (210) auch so eingerichtet ist, dass es die Samples von mindestens zwei Signalen kombiniert und die kombinierten Signale an seinem Ausgang bereitstellt, wenn das mindestens eine Überwachungselement (206) Sprache nur in den Samples des einen Signals erfasst.
  9. System nach Anspruch 8, dadurch gekennzeichnet, dass das Mischelement (206) auch so eingerichtet ist, dass es vor der Kombination die Werte von Signalsamples, in denen das mindestens eine Überwachungselement (206) keine Sprache erfasst, auf einen Wert setzt, der Stille entspricht.
  10. System nach Anspruch 6, dadurch gekennzeichnet, dass es ein mobiles Endgerät umfasst.
DE69738476T 1996-12-20 1997-12-18 Verfahren und Gerät für Anrufregistrierung in einem Speicher Expired - Lifetime DE69738476T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI965150A FI115867B (fi) 1996-12-20 1996-12-20 Menetelmä ja järjestelmä puhelun tallentamiseksi muistivälineelle
FI965150 1996-12-20

Publications (2)

Publication Number Publication Date
DE69738476D1 DE69738476D1 (de) 2008-03-13
DE69738476T2 true DE69738476T2 (de) 2008-05-21

Family

ID=8547336

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69738476T Expired - Lifetime DE69738476T2 (de) 1996-12-20 1997-12-18 Verfahren und Gerät für Anrufregistrierung in einem Speicher

Country Status (5)

Country Link
US (1) US6138091A (de)
EP (1) EP0849924B1 (de)
JP (1) JP3896400B2 (de)
DE (1) DE69738476T2 (de)
FI (1) FI115867B (de)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100255328B1 (ko) * 1998-02-18 2000-05-01 윤종용 음성 신호의 기록/재생이 가능한 이동 무선 전화기 및그 제어 방법
US7725307B2 (en) 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US7050977B1 (en) 1999-11-12 2006-05-23 Phoenix Solutions, Inc. Speech-enabled server for internet website and method
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
US7392185B2 (en) 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
GB2359155A (en) * 2000-02-11 2001-08-15 Nokia Mobile Phones Ltd Memory management of acoustic samples eg voice memos
DE10114997A1 (de) * 2001-03-26 2002-10-17 Elchanan Tanzer Aufnahmesystem für schnurlose Telefongeräte
US20030078083A1 (en) * 2001-10-18 2003-04-24 Meador Jack L. Radio communication device having voice messaging
US20040202291A1 (en) * 2002-08-27 2004-10-14 Skinner Davey Nyle Mobile phone with voice recording transfer function
GB2394113A (en) * 2002-10-08 2004-04-14 Nec Technologies Recording two or more sides of a telephone conversation simultaneously at a communications terminal (eg mobile phone)
US20040203627A1 (en) * 2003-01-17 2004-10-14 Loomis Robert Courtney Wireless communications device that records voice messages
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US8731914B2 (en) * 2005-11-15 2014-05-20 Nokia Corporation System and method for winding audio content using a voice activity detection algorithm
US8068619B2 (en) * 2006-05-09 2011-11-29 Fortemedia, Inc. Method and apparatus for noise suppression in a small array microphone system
JP2007312186A (ja) * 2006-05-19 2007-11-29 Nec Corp 通話音声録音再生装置及び通話音声録音再生方法
US20080085742A1 (en) * 2006-10-10 2008-04-10 Minna Karukka Mobile communication terminal
WO2008146397A1 (ja) * 2007-05-31 2008-12-04 Fujitsu Limited データ連携システム、データ連携方法およびデータ連携プログラム
US8103511B2 (en) * 2008-05-28 2012-01-24 International Business Machines Corporation Multiple audio file processing method and system
JP2010206299A (ja) * 2009-02-27 2010-09-16 Hitachi Information & Communication Engineering Ltd 通話録音装置及び通話録音方法
US8571528B1 (en) * 2012-01-25 2013-10-29 Intuit Inc. Method and system to automatically create a contact with contact details captured during voice calls
JP6149775B2 (ja) * 2014-03-28 2017-06-21 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US20190156834A1 (en) * 2017-11-22 2019-05-23 Toyota Motor Engineering & Manufacturing North America, Inc. Vehicle virtual assistance systems for taking notes during calls

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4365112A (en) * 1980-03-17 1982-12-21 Storage Technology Corporation Speech detector circuit for a TASI system
DE3425026A1 (de) * 1984-07-06 1986-02-06 Siemens AG, 1000 Berlin und 8000 München Verfahren zur abspeicherung von in sprachinformationen auftretenden sprachpausen
US4658425A (en) * 1985-04-19 1987-04-14 Shure Brothers, Inc. Microphone actuation control system suitable for teleconference systems
JP2845920B2 (ja) * 1989-02-09 1999-01-13 パイオニア株式会社 記録再生方式
JPH03178252A (ja) * 1989-12-07 1991-08-02 Fujitsu Ltd 音声加算回路
FI91457C (fi) * 1991-03-08 1994-06-27 Nokia Mobile Phones Ltd Menetelmä puheen tallentamiseksi muistivälineelle ja tallennetun puheen toistamiseksi sekä menetelmää käyttävä laite
US5259035A (en) * 1991-08-02 1993-11-02 Knowles Electronics, Inc. Automatic microphone mixer
US5440643A (en) * 1993-05-13 1995-08-08 Apple Computer, Inc. Audio peripheral mixer circuit and method for noise reduction
JPH0779204A (ja) * 1993-09-06 1995-03-20 Mitsubishi Electric Corp 移動体通信機器
JPH07169291A (ja) * 1993-12-09 1995-07-04 Olympus Optical Co Ltd 音声記録装置及び音声再生装置
AU709245B2 (en) * 1994-08-22 1999-08-26 Sony Corporation Transmitter-receiver
US5550893A (en) * 1995-01-31 1996-08-27 Nokia Mobile Phones Limited Speech compensation in dual-mode telephone
JPH08251260A (ja) * 1995-03-10 1996-09-27 Uniden Corp デジタルコードレス電話装置
JPH08289002A (ja) * 1995-04-18 1996-11-01 Matsushita Electric Ind Co Ltd 録音再生装置及び録音再生方法

Also Published As

Publication number Publication date
DE69738476D1 (de) 2008-03-13
EP0849924A2 (de) 1998-06-24
US6138091A (en) 2000-10-24
EP0849924A3 (de) 2003-06-04
EP0849924B1 (de) 2008-01-23
FI965150A0 (fi) 1996-12-20
FI115867B (fi) 2005-07-29
FI965150A (fi) 1998-06-21
JP3896400B2 (ja) 2007-03-22
JPH10222199A (ja) 1998-08-21

Similar Documents

Publication Publication Date Title
DE69738476T2 (de) Verfahren und Gerät für Anrufregistrierung in einem Speicher
DE69534561T2 (de) Sender-empfänger
DE60037647T2 (de) Sprachgesteuerter beantworter für mobiltelefone
DE19536212B4 (de) Anordnung zum Erkennen eines Anrufbeantworters
DE69927578T2 (de) Verfahren und vorrichtung zur durchführung einer mehrparteienkommunikation für ein kommunikationssystem
DE3534064C2 (de)
DE69931783T2 (de) Verbesserung bei digitaler Kommunikationseinrichtung
DE60025310T2 (de) Modenwechsel für Audiotranskodierer abhängig von Eingangssignalmerkmale
DE69833366T2 (de) Gerät zum speichern von sprachmitteilungen in einem schnurlosen telephonsystem
WO2006005566A1 (de) Konferenz-endgeraet mit echoreduktion fuer ein sprachkonferenzsystem
DE10251113A1 (de) Verfahren zum Betrieb eines Spracherkennungssystems
DE69827545T2 (de) Vorrichtung zur Erzeugung von Hintergrundrauschen
EP0989775A1 (de) Hörgerät mit Einrichtung zur Signalqualitätsüberwachung
DE69633154T2 (de) Schnurloses Telefongerät
DE60108708T2 (de) Tragbares Telefon mit einer Aufzeichnungsfunktion zur Speicherung von Telefongesprächen unter Anwendung einer reduzierten Speicherkapazität
DE3346792C2 (de) Anrufbeantworter zum Anschluß an eine Fernsprechleitung
DE2854401C2 (de) Anrufbeantworter
DE3503090C2 (de)
WO2000011853A1 (de) Schaltung und verfahren zur aufzeichnung und wiedergabe von sprache und anderen tönen in digitalen mobilfunkgeräten
DE69835048T2 (de) Fernsprechgerät mit einer digitalen Verarbeitungsschaltung für Sprachsignale und in diesem Gerät durchgeführtes Verfahren
DE60027140T2 (de) Sprachsynthetisierer auf der basis von sprachkodierung mit veränderlicher bit-rate
DE69736364T2 (de) Telefongerät mit einer Aufzeichnungsfunktion
DE69910833T2 (de) Verfahren und vorrichtung zur speicherbedarfsreduzierung für ein sprachaufnahmesystem
DE4426226A1 (de) Schaltungsanordnung zum Übertragen von codierten Sprachsignalen
DE69632557T2 (de) Telefonanrufbeantworter

Legal Events

Date Code Title Description
8364 No opposition during term of opposition