CN100583909C - 移动设备上多传感语音增强的装置 - Google Patents

移动设备上多传感语音增强的装置 Download PDF

Info

Publication number
CN100583909C
CN100583909C CN200510052873A CN200510052873A CN100583909C CN 100583909 C CN100583909 C CN 100583909C CN 200510052873 A CN200510052873 A CN 200510052873A CN 200510052873 A CN200510052873 A CN 200510052873A CN 100583909 C CN100583909 C CN 100583909C
Authority
CN
China
Prior art keywords
signal
formula equipment
sensor signals
ambulatory handheld
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200510052873A
Other languages
English (en)
Other versions
CN1662018A (zh
Inventor
M·J·辛克莱尔
黄学东
张正友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ivalley Holding Co Ltd
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1662018A publication Critical patent/CN1662018A/zh
Application granted granted Critical
Publication of CN100583909C publication Critical patent/CN100583909C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23NMACHINES OR APPARATUS FOR TREATING HARVESTED FRUIT, VEGETABLES OR FLOWER BULBS IN BULK, NOT OTHERWISE PROVIDED FOR; PEELING VEGETABLES OR FRUIT IN BULK; APPARATUS FOR PREPARING ANIMAL FEEDING- STUFFS
    • A23N12/00Machines for cleaning, blanching, drying or roasting fruits or vegetables, e.g. coffee, cocoa, nuts
    • A23N12/02Machines for cleaning, blanching, drying or roasting fruits or vegetables, e.g. coffee, cocoa, nuts for washing or blanching
    • A23N12/023Machines for cleaning, blanching, drying or roasting fruits or vegetables, e.g. coffee, cocoa, nuts for washing or blanching for washing potatoes, apples or similarly shaped vegetables or fruit
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L15/00Washing or rinsing machines for crockery or tableware
    • A47L15/0002Washing processes, i.e. machine working principles characterised by phases or operational steps
    • A47L15/0015Washing processes, i.e. machine working principles characterised by phases or operational steps other treatment phases, e.g. steam or sterilizing phase
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L15/00Washing or rinsing machines for crockery or tableware
    • A47L15/02Washing or rinsing machines for crockery or tableware with circulation and agitation of the cleaning liquid in the cleaning chamber containing a stationary basket
    • A47L15/13Washing or rinsing machines for crockery or tableware with circulation and agitation of the cleaning liquid in the cleaning chamber containing a stationary basket using sonic or ultrasonic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6008Substation equipment, e.g. for use by subscribers including speech amplifiers in the transmitter circuit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/605Portable telephones adapted for handsfree use involving control of the receiver volume to provide a dual operational mode at close or far distance from the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6016Substation equipment, e.g. for use by subscribers including speech amplifiers in the receiver circuit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/12Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/13Hearing devices using bone conduction transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Abstract

提供了一种移动设备,它包括一可由用户的手指或大拇指操纵的数字输入、一气导麦克风和一提供指示语音的备选传感器信号的备选传感器。在某些实施例中,该移动设备也包括一邻近传感器,它提供指示从移动设备到对象的距离的邻近信号。在某些实施例中,来自气导麦克风的信号、备选传感器信号和邻近信号用于形成干净语音值的估算。在另外的实施例中,基于干净语音值中的噪声的量产生通过移动设备中的扬声器的声音。在其它实施例中,通过扬声器产生的信号基于邻近传感器信号。

Description

移动设备上多传感语音增强的装置
技术领域
本发明涉及降噪,尤其涉及从由移动手持式设备接收的语音信号中移除噪声。
背景技术
诸如移动电话和个人数字助理等提供电话功能或接受语音输入的移动手持式设备通常在诸如繁忙的街道、餐馆、机场和汽车等不利的噪声环境中使用。这些环境中强大的环境噪声使用户的语音变得模糊,并且很难理解一个人在说什么。
尽管开发了试图基于噪声模型移除噪声的噪声滤除系统,然而这些系统尚不能移除所有的噪声。具体地,许多这样的系统发现很难移除在背景中包括其它人的说话的噪声。其一个原因是这些系统及其难以(如果不是不可能的话)确定由麦克风接收的语音信号是来自除使用该移动设备的人之外的其他人。
对于电话头戴式耳机,它通过环绕在用户头部或耳朵的周围定位在用户的头部,开发了通过依赖于头戴式耳机中的附加类型的传感器来提供更健壮的噪声滤除系统。在一个示例中,一骨导传感器被放置在头戴式耳机的一端,并由头戴式耳机的弹力挤压到与覆盖用户头盖骨、耳朵或下颚骨的皮肤接触。该骨导传感器检测头盖骨、耳朵或下颚骨中在用户说话时引起的振动。使用来自骨导传感器的信号,该系统能够更好地识别用户何时在说话,并且结果能够更好地滤除语音信号中的噪声。
尽管这一系统对头戴式耳机能够起较好的作用,其中,骨导传感器和用户之间的接触由头戴式耳机的机械设计来维护,然而这些系统不能直接用于手持式移动设备,因为用户很难将骨导传感器维持在正确的位置,并且这些系统未考虑骨导传感器可能无法保持在正确的位置。
发明内容
提供了一种移动设备,包括可由用户的手指或大拇指操纵的数字输入,以及一气导麦克风和提供指示语音的备选传感器信号的备选传感器。在某些实施例中,移动设备也包括一邻近传感器,它提供指示从移动设备到对象的邻近性的信号。在某些实施例中,来自气导麦克风的信号、备选传感器信号以及邻近信号用于形成对干净语音值的估算。在另外的实施例中,基于干净信号值中的噪声量,通过移动设备中的扬声器产生声音。在其它实施例中,通过扬声器产生的声音基于邻近传感器信号。
附图说明
图1是本发明的一个实施例的透视图。
图2在用户头部的左侧的位置上示出了图1的电话。
图3在用户头部的右侧的位置上示出了图1的电话。
图4是骨导麦克风的框图。
图5是本发明的一个替换实施例的透视图。
图6是本发明的一个实施例中的备选骨导麦克风的横截面。
图7是本发明的一个实施例中的移动设备的框图。
图8是本发明的通用语音处理系统的框图。
图9是本发明的一个实施例中用于训练降噪参数的框图。
图10是使用图9的系统训练降噪参数的流程图。
图11是本发明的一个实施例中从噪声测试语音信号中标识出干净语音信号的估算的系统的框图。
图12是使用图11的系统标识干净语音信号的估算的方法的流程图。
图13是标识干净语音信号的估算的替换系统的框图。
图14是标识干净语音信号的估算的第二替换系统的框图。
图15是使用图14的系统标识干净语音信号估算的方法的流程图。
图16是本发明的移动设备的另一实施例的透视图。
具体实施方式
本发明的实施例提供了一种手持式移动设备,它包含可用于语音检测和噪声滤除的气导麦克风以及备选传感器。图1提供了一个示例实施例,其中,手持式移动设备是移动电话100。移动电话100包括键区102、显示屏104、光标控制106、气导麦克风108、扬声器110、两个骨导麦克风112和114以及可任选的邻近传感器116。
触摸垫102允许用户将数字和字母输入到移动电话中。在其它实施例中,触摸垫102与显示屏104以触摸屏的形式组合。光标控制106允许用户加亮并选择显示屏104上的信息,并滚动通过大于显示屏104的图像和页面。
如图2和3所示,当移动电话100被防止在标准位置用于通过电话对话时,扬声器110位于用户左耳200或右耳300的附近,并且气导麦克风108位于用户口部202的附近。当电话位于用户的左耳时,如图2所示,骨导麦克风114接触用户的头盖骨或耳朵,并产生可用于从由气导麦克风108接收的语音信号中移除噪声的备选传感器信号。当电话位于用户的右耳时,如图3所示,骨导麦克风112接触用户的头盖骨或耳朵,并产生可用于从语音信号中移除噪声的备选传感器信号。
可任选邻近传感器116指示电话与用户如何接近。如下文进一步讨论的,该信息用于对骨导麦克风在产生干净语音值时的贡献进行加权。一般而言,如果邻近检测器检测到电话就在用户旁边,则骨导麦克风信号被赋予比远离用户某一距离时更大的权值。这一调整反映了这样一个事实:当骨导麦克风与用户接触时,其信号更能够表示用户正在说话。当它远离用户时,它更可疑地为环境噪声。邻近传感器在本发明的实施例中使用,因为用户不总是将电话压向其头部。
图4示出了本发明的骨导传感器400的一个实施例。在传感器400中,一软弹性桥402黏附在正常的气导麦克风406的横隔膜404上。该软桥402将来自用户的皮肤接触408的振动直接传导到麦克风406的横隔膜。横隔膜404的移动由麦克风406中的转换器转换成电信号。
图5提供了本发明的手持式移动设备的一个替换移动电话实施例500。移动电话500包括键区502、显示屏504、光标控制506、气导麦克风508、扬声器510和组合的骨导麦克风和邻近传感器512。
如图6的横截面中所示的,组合的骨导麦克风和邻近传感器512包括一软的、填充了介质(用液体或弹性体)衬垫600,它具有外表面602,它被设计成当用户将电话紧贴在耳朵上时与用户接触。衬垫600形成了为来自扬声器的声音提供了通路的开口周围的环,扬声器位于该开口中或直接在电话500内位于开口之下。衬垫600不限于这一形状,可对该衬垫使用任何形状。然而,一般而言,如果衬垫600包括扬声器501的左边和右边部分,则它是较佳的,使得衬垫的至少一个部分与用户接触,而无论用户的哪一耳朵在电话旁边。衬垫的该部分可以是外部连续的,或可以是外部分离的,但是在电话内流畅地连接在一起。
电子压力转换器604液压地连接到衬垫600中的液体或弹性体中,并将衬垫600中的液体的压力转换成导体606上的电信号。电子压力转换器604的示例包括基于MEMS的转换器。一般而言,压力转换器604应当具有高频响应。
导线606上的电信号包括两个分量:DC分量和AC分量。DC分量提供了邻近传感器信号,因为当电话被压向用户的耳朵时,衬垫600内的静压将高于电话远离用户的耳朵某一距离时的静压。电信号的AC分量提供了骨导麦克风信号,因为用户头盖骨、下颚或耳朵的骨头中的振动引起衬垫600中的压力波动,它们由压力转换器604转换成AC电信号。在一个实施例中,将滤波器应用到电信号,以允许信号的DC分量和高于最小频率的AC能够通过。
尽管上文描述了骨导传感器的这两个示例,然而骨导传感器的其它形式也处于本发明的范围之内。
图7所示是本发明的一个实施例中移动设备700的框图。移动设备700包括微处理器702、存储器704、输入/输出(I/O)接口706和用于与远程计算机、通信网络或其它移动设备通信的通信接口708。在一个实施例中,上述组件被耦合在一起,用于通过合适的总线710彼此通信。
存储器704可以被实现为非易失电子存储器,如具有电池备份模块(未示出)的随机存取存储器(RAM),使得当移动设备700的总电源被关闭时,储存在存储器704中的信息也不会丢失。或者,存储器704的所有或部分可以是易失或非易失可移动存储器。存储器704的一部分较佳地被分配为用于程序执行的可寻址存储器,而存储器704的另一部分较佳地用于存储,如模拟盘驱动器上的存储。
存储器704包括操作系统712、应用程序714以及对象存储716。在操作过程中,操作系统712较佳地由处理器702从存储器704中执行。在一个较佳实施例中,操作系统712是可从微软公司购买的
Figure C20051005287300071
CE品牌的操作系统。操作系统712较佳地被设计成用于移动设备,并实现可由应用程序714通过一组展现的应用编程接口和方法来使用的数据库特征。对象存储716中的对象由应用程序714和操作系统712至少部分地响应于对所展现的应用编程接口和方法的调用来维护。
通信接口708表示允许移动设备700发送和接收信息的多种设备和技术。在移动电话环境中,通信接口708代表了蜂窝电话网络接口,它与蜂窝电话网络通信以允许呼叫可被放置或接收。可能由通信接口708表示的其它设备包括有线和无线调制解调器、卫星接收器和广播调谐器,此处仅举几个例子。移动设备700也可直接连接到计算机上,以与其交换数据。在这些情况下,通信接口708可以是红外收发器或串行或并行通信连接,所有这些都能够发送流信息。
由处理器702执行来实现本发明的计算机可执行指令可以储存在存储器704中,或通过通信接口708接收。这些指令在计算机可读介质中找到,包括但不限于计算机存储介质和通信介质。
计算机存储介质包括以用于储存诸如计算机可读指令、数据结构、程序模块或其它数据等信息的任一方法或技术实现的易失和非易失,可移动和不可移动介质。计算机存储介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁盒、磁带、磁盘存储或其它磁存储设备、或可以用来储存所期望的信息并可访问的任一其它介质。
通信介质通常在诸如载波或其它传输机制的已调制数据信号中包含计算机可读指令、数据结构、程序模块或其它数据,并包括任一信息传送介质。术语“已调制数据信号”指以对信号中的信息进行编码的方式设置或改变其一个或多个特征的信号。作为示例而非局限,通信介质包括有线介质,如有线网络或直接连线连接,以及无线介质,如声学、RF、红外和其它无线介质。上述任一的组合也应当包括在计算机可读介质的范围之内。
输入/输出接口706表示到包括扬声器、数字输入732(如一个或一组按钮、触摸屏、跟踪球、鼠标垫、滚轴或这些组件的组合,它们可由用户的大拇指或手指操纵)、显示屏734、气导麦克风736、备选传感器738、备选传感器740和邻近传感器742的输入和输出设备的集合的接口。在一个实施例中,备选传感器738和740是骨导麦克风。上文列出的设备作为示例,不需要在移动设备700中都存在。此外,在至少一个实施例中,备选传感器和邻近传感器被组合成单个传感器,它提供邻近传感器信号和备选传感器信号。这些信号可被放置在单独的导线上,或可以是单个导线上的信号的分量。另外,在本发明的范围之内,其它输入/输出设备可以附加到移动设备700或在其中找到。
图8提供了本发明的实施例的语音处理系统的基本框图。在图8中,说话者800生成语音信号802,它由气导麦克风804以及备选传感器806和备选传感器807之一或两者检测。备选传感器的一个示例是骨导传感器,它位于用户的脸部或头盖骨(如颚骨)上,或与其相邻,或在用户的耳朵上,并传感对应于由用户生成的语音的耳朵、头骨或颚骨的振动。备选传感器的另一示例是红外传感器,它被瞄准并检测用户的口部运动。注意,在某些实施例中,仅存在一个备选传感器。气导麦克风804是常用于将音频空气波转换成电信号的麦克风的类型。
气导麦克风804也接收由一个或多个噪声源810生成的噪声808。根据备选传感器的类型和噪声级别,噪声808也可由备选传感器806和807检测。然而,在本发明的实施例中,备选传感器806和807通常比气导麦克风804对环境噪声更不敏感。由此,由备选传感器806和807分别生成的备选传感器信号812和813一般比由气导麦克风804生成的气导麦克风信号814包括更少的噪声。
如果有两个备选传感器,如两个骨导传感器,则传感器信号812和813可任选地被提供给比较/选择单元815。比较/选择单元815比较这两个信号的强度,并选择较强的信号作为其输出817。较弱的信号不被传递用于进一步处理。对于移动电话环境,如图1-3的移动电话,比较/选择单元815通常选择由与用户皮肤接触的骨导传感器生成的信号。由此,在图2中,来自骨导传感器114的信号将被选中,而在图3中,来自骨导传感器112的信号将被选中。
备选传感器信号817和气导麦克风信号814被提供给干净信号估算器816,它通过下文详细描述的过程估算干净信号818。可任选地,干净信号估算器816也接收来自邻近传感器832的邻近信号830,它用于估算干净信号818。如上所述,在某些实施例中,邻近传感器可以与备选传感器信号相组合。干净信号估算818被提供给语音处理820。干净语音信号818可以是经滤波的时域信号或特征域矢量。如果干净信号估算818是时域信号,则语音处理820可采用收听者、蜂窝电话发送器、语音编码系统或语音识别系统的形式。如果干净语音信号818是特征域矢量,则语音处理820通常是语音识别系统。
干净信号估算器816也产生噪声估算819,它指示干净语音信号818中估算的噪声。噪声估算819被提供给侧音生成器821,它基于噪声估算819生成通过移动设备的扬声器的音调。具体地,当噪声估算819提高时,侧音生成器812提高了侧音的音量。
侧音向用户提供了反馈,指示用户是否将移动设备保持在最佳的位置,以充分利用备选传感器。例如,如果用户未将骨导传感器压紧其头部,则干净信号估算器将接收到较差的备选传感器信号,并且由于较差的备选传感器信号会产生含噪声的干净信号818。这会导致较响的侧音。当用户将骨导传感器与其头部接触时,备选传感器信号将得到改善,由此降低了干净信号818中的噪声,并降低了侧音的音量。由此,用户可基于侧音中的反馈快速地了解如何握住电话以最好地降低干净信号中的噪声。
在一个替换实施例中,侧音是基于来自邻近传感器32的邻近传感器信号803生成的。当邻近传感器指示电话接触或极接近用户的头部时,侧音音量较低。当邻近传感器指示电话远离用户的头部时,侧音将更响。
本发明使用若干方法和系统,以利用气导麦克风814、备选传感器信号817和可任选邻近传感器信号830估算干净信号。一种系统使用立体声训练数据来训练备选传感器信号的纠正矢量。当这些纠正矢量稍后被添加到测试备选传感器矢量时,它们提供干净信号矢量的估算。本系统的一个进一步扩展是首先跟踪时变失真,然后将该信息结合到纠正矢量的计算和干净信号的估算中。
第二种系统提供了由纠正矢量生成的干净信号估算和通过从气导信号中减去气导测试信号中的当前噪声的估算形成的估算之间的内插。第三种系统使用备选传感器信号来估算语音信号的基音,然后使用所估算的基音来标识干净语音信号的估算。这些系统的每一个在下文单独地讨论。
训练立体声纠正矢量
图9和10提供了本发明的两个实施例的训练立体声纠正矢量的框图和流程图,它们依赖于纠正矢量来生成干净信号的估算。
标识纠正矢量的方法在图10的步骤1000开始,其中,将“干净”气导麦克风信号转换成特征矢量序列。为此,图9的说话者900对气导麦克风910说话,后者将音频波转换成电信号。电信号然后由模-数转换器914采样,以生成数字值序列,它们由帧构造器916组合成值的帧。在一个实施例中,A-D转换器914以16kHz和每样值16比特对模拟信号进行采样,由此创建了每秒32千字节的语音数据,并且帧构造器916每10毫秒创建包括25毫秒数据的新帧。
由帧构造器916提供的每一数据帧由特征提取器918转换成特征矢量。在一个实施例中,特征提取器918形成倒谱特征。这类特征的示例包括LPC导出的倒谱和梅尔(Mel)频率倒谱系数。可用于本发明的其它可能的矢量提取模块的示例包括用于执行线性预测编码(LPC)、感知线性预测(PLP)以及听觉模型特征提取的模块。注意,本发明不限于这些特征提取模块,在本发明的环境中也可使用其它模块。
在图10的步骤1002,将备选传感器信号转换成特征矢量。尽管步骤1002的转换被示出为在步骤1000的转换之后发生,然而在本发明中,转换的任一部分可以在步骤1000之前、期间或之后发生。步骤1002的转换通过类似于上文相对于步骤1000所描述的过程来执行。
在图9的实施例中,该过程在备选传感器902和903检测到与说话者900的语音产生相关联的物理事件开始,如骨振动或面部运动。由于备选传感器902和903在移动设备上相互隔开,它们不会检测到关于语音产生的相同的值。备选传感器902和903将物理事件转换成模拟电信号。这些电信号被提供给比较/选择单元904,它标识这两个信号中较强的一个,并在其输出提供较强的信号。注意,在某些实施例中,仅使用一个备选传感器。在这一情况下,比较/选择单元904不存在。
所选择的模拟信号由模-数转换器905采样。A/D转换器905的采样特征与上文相对于A/D转换器914所描述的相同。由A/D转换器905提供的样值由帧构造器906收集成帧,后者以类似于帧构造器916的方式运作。样值帧然后由特征提取器908转换成特征矢量,后者使用与特征提取器918相同的特征提取方法。
备选传感器信号和气导信号的特征矢量被提供给图9中的降噪训练器902。在图10的步骤1004,降噪训练器920将备选传感器信号的特征矢量组合成混合分量。这一组合可通过使用最大似然性训练技术将类似的特征矢量组合在一起来完成,或通过将表示语音信号的时间部分的特征矢量组合在一起完成。本领域的技术人员将认识到,可使用组合特征矢量的其它技术,并且上文列出的两个技术仅作为示例来提供。
在图10的步骤1008,降噪训练器902然后确定每一混合分量s的纠正矢量rs。在一个实施例中,每一混合分量的纠正矢量使用最大似然性标准来确定。在这一技术中,纠正矢量计算如下:
r s = Σ t p ( s | b t ) ( x t - b t ) Σ t p ( s | b t ) 公式1
其中xt是帧t的气导矢量值,bt是帧t的备选传感器矢量值。在公式1中:
p ( s | b t ) = p ( b t | s ) p ( s ) Σ s p ( b t | s ) p ( s ) 公式2
其中,p(s)仅是多个混合分量中的一个,p(bt|s)被模型化为高斯分布:
p(bt|s)=N(bt;μb,Γb)                                公式3
它具有均值μb和方差Γb,它们使用期望值最大化(EM)算法来训练,其中,每一次迭代包括以下步骤:
γs(t)=p(s|bt)                   公式4
μ s = Σ t γ s ( t ) b t Σ t γ s ( t ) 公式5
Γ s = Σ t γ s ( t ) ( b t - μ s ) ( b t - μ s ) T Σ t γ s ( t ) 公式6
公式4是EM算法中的E步骤,它使用先前估算的参数。公式5和公式6是M步骤,它使用E步骤的结果更新参数。
该算法的E步骤和M步骤反复,直到确定了模型参数的稳定值。这些参数然后用于评估公式1,以形成纠正矢量。纠正矢量和模型参数然后被储存在降噪参数存储922中。
在步骤1008对每一混合分量确定了纠正矢量之后,训练本发明的降噪系统的过程完成。一旦对每一混合分量确定了纠正矢量,该矢量可在本发明的降噪技术中使用。下文讨论使用就纠正矢量的两个单独的降噪技术。
使用纠正矢量和噪声估算的降噪
基于纠正矢量和噪声估算降低含噪声的语音信号中的噪声的系统和方法分别在图11的框图和图12的流程图中示出。
在步骤1200,由气导麦克风1104检测的测试信号被转换成特征矢量。由麦克风1104接收的音频测试信号包括来自说话者1100的语音和来自一个或多个噪声源1102的加性噪声。由麦克风1104检测到的音频测试信号被转换成电信号,它被提供给模-数转换器1106。
A-D转换器1106将来自麦克风1104的模拟信号转换成一系列数字值。在若干实施例中,A-D转换器1106以16kHz和每样值16比特对模拟信号进行采样,由此创建了每秒32千字节的语音数据。这些数字值被提供给帧构造器1108,在一个实施例中,帧构造器1108将值组合成25毫秒的帧,其起始处相隔10毫秒。
由帧构造器1108创建的数据帧被提供给特征提取器1110,它从每一帧中提取特征。在一个实施例中,该特征提取器不同于用于训练纠正矢量的特征提取器908和918。具体地,在这一实施例中,特征提取器1110产生功率谱值而非倒谱值。所提取的特征被提供给干净信号估算器1122、语音检测单元1126和噪声模型训练器1124。
在步骤1202,与说话者1100的语音产生相关联的物理事件,如骨振动或面部运动被转换成特征矢量。尽管在图12中被示出为单独的步骤,然而本领域的技术人员将认识到,该步骤可以与步骤1200同时完成。在步骤1202中,由备选传感器1112和1114之一或两者检测物理事件。备选传感器1112和1114基于物理事件生成模拟电信号。模拟信号被提供给比较和选择单元1115,它选择较大幅度的信号作为其输出。注意,在某些实施例中,仅提供了一个备选传感器。在这一实施例中,比较和选择单元1115是不需要的。
所选择的模拟信号由模-数转换器1116转换成数字信号,并且所得的数字样值由帧构造器1118组合成帧。在一个实施例中,模-数转换器1116和帧构造器1118以类似于模-数转换器1106和帧构造器1108的方式运作。
数字值的帧被提供给特征提取器1120,它使用用于训练纠正矢量的相同的特征提取技术。如上所述,这类特征提取模块的示例包括用于执行线性预测编码(LPC)、LPC导出倒谱、感知线性预测(PLP)、听觉模型特征提取以及梅尔频率倒谱系数(MFCC)特征提取的模块。然而,在许多实施例中,使用了产生倒谱特征的特征提取技术。
特征提取模块产生特征矢量流,其每一个都与语音信号的一个单独帧相关联。该特征矢量流被提供给干净信号估算器1122。
来自帧构造器1118的值帧也被提供给特征提取器1121,在一个实施例中,特征提取器1121提取每一帧的能量。每一帧的能量值被提供给语音检测单元1126。
在步骤1204,语音检测单元1126使用备选传感器信号的能量特征来确定何时可能存在语音。该信息被传递到噪声模型训练器1124,在步骤1206,它试图在没有语音的时间段中对噪声建模。
在一个实施例中,语音检测单元1126首先搜索帧能量值序列以找出能量中的峰值。它然后搜索峰值之后的谷值。该谷值的能量被称为能量分隔符d。为确定帧是否包含语音,然后确定帧能量e与能量分隔符d之间的比值k,如下:k=e/d。然后确定该帧的语音置信度q,如下:
q = 0 : k < 1 k - 1 &alpha; - 1 : 1 &le; k &le; &alpha; 1 : k > &alpha; 公式7
其中,α定义了两种状态之间的转移,在一个实施例中被设为2。最后,将其5个相邻帧(包括其本身)的平均置信度值用作该帧的最终置信度值。
在一个实施例中,使用固定的阈值来确定是否存在语音,使得如果置信度值超过阈值,则该帧被认为包含语音,如果置信度值不超过阈值,则该帧被认为包含非语音。在一个实施例中,使用了0.1的阈值。
对于由语音检测单元1126检测的每一非语音帧,噪声模型训练器1124在步骤1206更新噪声模型1125。在一个实施例中,噪声模型1125是高斯模型,它具有均值μn和方差∑n。该模型基于非语音的最近帧的移动窗。用于从窗中的非语音帧中确定均值和方差的技术在本领域中是众所周知的。
参数存储922中的纠正矢量和模型参数以及噪声模型1125,连同备选传感器的特征矢量b和含噪声的气导麦克风信号的特征矢量Sy一起被提供给干净信号估算器1122。在步骤1208,干净信号估算器1122基于备选传感器特征矢量、纠正矢量和备选传感器的模型参数估算干净语音信号的初始值。具体地,干净信号的备选传感器估算计算如下:
x ^ = b + &Sigma; s p ( s | b ) r s 公式8
其中,是倒谱域中的干净信号估算,b是备选传感器特征矢量,p(s|b)是使用上文的公式2来确定的,rs是混合分量s的纠正矢量。由此,公式8中的干净信号估算通过将备选传感器特征矢量添加到纠正矢量的加权和来形成,其中,加权基于给定备选传感器特征矢量时混合分量的概率。
在步骤1210,通过将初始备选传感器干净语言估算与从含噪声的气导麦克风矢量和噪声模型中形成的干净语音估算相组合,初始备选传感器干净语音估算被净化。这得到一经净化的干净语音估算1128。为将初始干净信号估算的倒谱值与含噪声的气导麦克风的功率谱特征矢量相组合,使用以下公式将倒谱值转换成功率谱域:
S ^ x | b = e C - 1 x ^ 公式9
其中,C-1是离散余弦反变换,
Figure C20051005287300144
是基于备选传感器的干净语音的功率谱估算。
一旦已将来自备选传感器的初始干净信号估算放入功率谱域中,它可与含噪声的气导麦克风矢量和噪声模型相组合,如下:
S ^ x = ( &Sigma; n - 1 + &Sigma; x | b - 1 ) - 1 [ &Sigma; n - 1 ( S y - &mu; n ) + &Sigma; x | b - 1 S ^ x | b ] 公式10
其中,
Figure C20051005287300146
是功率谱域中经净化的干净信号估算,Sy是含噪声的气导麦克风特征矢量,(μn,∑n)是先验噪声模型(见1124)的均值和协方差,
Figure C20051005287300147
是基于备选传感器的初始干净信号估算,∑x|b是给定备选传感器的测量时干净信号的条件概率分布的协方差矩阵。∑x|b可被计算如下。设J表示公式9的右侧的函数的雅各比行列式。设∑是
Figure C20051005287300148
的协方差矩阵,则
Figure C20051005287300149
的协方差为
x|b=J∑JT                        公式11
在一简化的实施例中,公式10被重写成以下公式:
S ^ x = &alpha; ( f ) ( S y - &mu; n ) + ( 1 - &alpha; ( f ) ) S ^ x | b 公式12
其中,α(f)是时间和频带的函数。例如,如果备选传感器的频带达3KHz,对低于3KHz的频带选择α(f)为0。基本上,对于低频带,来自备选传感器的初始干净信号估算是可信的。
对于高频带,来自备选传感器的初始干净信号估算并不可靠。直观上,当在当前帧上频带的噪声较小时,选择较大的α(f),使得对这一频带可从气导麦克风中取出更多的信息。否则,通过选择较小的α(f)使用来自备选传感器的更多的信息。在一个实施例中,使用来自备选传感器的初始干净信号估算的能量来确定每一频带的噪声级别。设E(f)表示频带f的能量。设M=MaxfE(f),作为f的函数,α(f)被定义如下:
Figure C20051005287300151
公式13
其中,使用了线性内插从3K过渡到4K,以确保α(f)的平滑性。
在一个实施例中,移动设备与用户头部的邻近性被结合到α(f)的确定中。具体地,如果邻近传感器832产生最大距离值D和当前距离值d,则公式13可被修改为:
&alpha; ( f ) = &beta; E ( f ) M + ( 1 - &beta; ) d D : f &GreaterEqual; 4 K f - 3 K 1 K &alpha; ( 4 K ) : 3 K < f < 4 K 0 : f &le; 3 K 公式14
其中,β在0到1之间,并基于哪一矢量、能量或邻近性被认为能够提供气导麦克风的噪声模型或备选传感器的纠正矢量将提供干净信号的最佳估算的最佳指示来选择。
如果β被设为0,则α(f)不再是频率相关的,并简单地变为:
&alpha; = d D 公式15
功率谱域中经净化的干净信号估算可用于构造维纳(Wiener)滤波器,以对含噪声的气导麦克风信号进行滤波。具体地,设置维纳滤波器h,使得:
H = S ^ x S y 公式16
该滤波器然后可被应用于时域含噪声的气导麦克风信号,以产生经降噪的或干净的时域信号。经降噪的信号可被提供给收听者或可应用于语音识别器。
注意,公式12提供了经净化的干净信号估算,它是两个因子的加权和,其中一个是来自备选传感器的干净信号估算。该加权和可被扩充以包括附加备选传感器的附加因子。由此,可使用一个以上备选传感器来生成干净信号的独立估算。这多个估算然后可使用公式12来组合。
在一个实施例中,经净化的干净信号估算中的噪声也被估算。在一个实施例中,该噪声被认为是0均值的高斯型,其协方差被确定如下:
&Sigma; x = ( &Sigma; n - 1 + &Sigma; x | b - 1 ) - 1 = &Sigma; n &Sigma; x | b / ( &Sigma; n + &Sigma; x | b )
其中,∑n是气导麦克风中的噪声的方差,∑x|b是来自备选传感器的估算中的噪声的方差。具体地,如果备选传感器不与皮肤表面较好地接触,则∑x|b较大。接触的程度可通过使用附加邻近传感器或分析备选传感器来测量。对于后者,观察到如果接触良好,则备选传感器几乎不产生高频响应(大于4KHz),则用低频能量(小于3KHz)与高频能量之比来测量接触。该比值越高,接触越好。
在某些实施例中,干净信号估算中的噪声用于生成如上文相对于图6所描述的侧音。当经净化的干净信号估算中的噪声增加时,侧音的音量也提高,以鼓励用户将备选传感器放置在更好的位置,使得增强处理得以改进。例如,侧音鼓励用户将骨导传感器压向其头部,使得增强处理得以改进。
使用纠正矢量而没有噪声估算的降噪
图13提供了本发明中估算干净语音值的替换系统的框图。图13的系统类似于图11的系统,除干净语音值的估算在不需要气导麦克风或噪声模型的情况下形成之外。
在图13中,与产生语音的说话者1300相关联的物理事件由备选传感器1302、模-数转换器1304、帧构造器1306和特征提取器1308以与上述图11的备选传感器1114、模-数转换器1116、帧构造器1117和特征提取器1118相似的方式转换成特征矢量。注意,尽管在图13中仅示出了一个备选传感器,然而如图11中一样,可使用附加的备选传感器,外加图11中讨论的比较和选择单元。
来自特征提取器1308的特征矢量以及降噪参数922被提供给干净信号估算器1310,它使用上文的公式8和9确定干净信号值1312
Figure C20051005287300162
的估算。
功率谱域中干净信号估算
Figure C20051005287300163
可用于构造维纳滤波器,以对含噪声的气导麦克风信号进行滤波。具体地,设置维纳滤波器H,使得:
H = S ^ x | b S y 公式17
该滤波器可被应用于时域含噪声的气导麦克风信号,以产生经降噪的或干净信号。经降噪的信号可被提供给收听者或被应用于语音识别器。
或者,公式8中计算的倒谱域中的干净信号估算
Figure C20051005287300172
可被直接应用于语音识别系统。
使用基音跟踪的降噪
生成干净语音信号估算的一个替换技术在图14的框图和图15的流程图中示出。具体地,图14和15的实施例通过使用备选传感器然后使用基音将含噪声的气导麦克风信号分解成谐波分量和随机分量,来标识语音信号的基音,从而确定了干净信号估算。由此,含噪声的信号被表示为:
y=yh+yr            公式18
其中,y是含噪声的信号,yh是谐波分量,yr是随机分量。使用谐波分量和随机分量的加权和来形成表示经降噪的语音信号的经降噪的特征矢量。
在一个实施例中,谐波分量被模型化为谐波上相关的正弦和,使得:
y h = &Sigma; k = 1 K a k cos ( k &omega; 0 t ) + b k sin ( k &omega; 0 t ) 公式19
其中,ω0是基频或基音频率,K是信号中的谐波总数。
由此,为标识谐波分量,必须确定基音频率和幅度参数{a1a2...akb1b2...bk}的估算。
在步骤1500,收集含噪声的语音信号,并将其转换成数字样值。为此,气导麦克风1404将来自说话者1400和一个或多个加性噪声源1402的音频波转换成电信号。电信号然后由模-数转换器1406转换,以生成一数字值序列。在一个实施例中,A-D转换器1406以16kHz和每样值16比特对模拟信号进行采样,由此创建了每秒32千字节的语音数据。在步骤1502,数字样值由帧构造器1408组合成帧。在一个实施例中,帧构造器1408每10毫秒创建包括25毫秒数据的新帧。
在步骤1504,与语音产生相关联的物理事件由备选传感器1444检测。在本实施例中,能够检测谐波分量的备选传感器,如骨导传感器最适合用作备选传感器1444。注意,尽管步骤1504被示出为与步骤1500分离,然而本领域的技术人员将认识到,这些步骤可以同时执行。另外,尽管在图14中仅示出了一个备选传感器,然而可如图11中一样使用附加的备选传感器,外加图11中所述的比较和选择单元。
由备选传感器1444生成的模拟信号由模-数转换器1446转换成数字样值。数字样值然后在步骤1506由帧构造器1448组合成帧。
在步骤1508,备选传感器信号的帧由基音跟踪器1450用于标识语音的基音频率或基频。
可使用多种可用基音跟踪系统的任一种来确定基音频率的估算。在许多这样的系统中,候选基音用于标识备选传感器信号的片断中心之间的间隔。对于每一候选基音,确定连续的语音片断之间的相关。一般而言,提供最佳相关的候选基音是该帧的基音频率。在某些系统中,使用附加信息来净化基音选择,如信号的能量和/或期望基音跟踪。
给定来自基音跟踪器1450的基音的估算,在步骤1510,气导信号矢量可被分解成谐波分量和随机分量。为此,公式19被重写为:
y=Ab    公式20
其中,y是含噪声的语音信号的N个样值的矢量,A是N×2K矩阵,由以下公式给出:
A=[AcosAsin]                 公式21
其元素为
Acos(k,t)=cos(kω0t)    Asin(k,t)=sin(kω0t)           公式22
并且b是2K×1的矢量,由以下公式给出:
bT=[a1a2...akb1b2...bk]                公式23
则振幅系数的最小二乘解为:
b ^ = ( A T A ) - 1 A T y 公式24
使用
Figure C20051005287300182
,含噪声的语音信号的谐波分量的估算可以确定如下:
y h = A b ^ 公式25
随机分量的估算则被计算如下:
yr=y-yh    公式26
由此,使用上述公式20-26,谐波分解单元1410能够产生谐波分量样值1412的矢量yh和随机分量样值的矢量yr
在将帧的样值分解成谐波和随机样值之后,在步骤1512对谐波分量确定一比例缩放参数或权值。该比例缩放参数被用作经降噪的语音信号的计算的一部分,如下文进一步讨论的。在一个实施例中,比例缩放参数计算如下:
&alpha; h = &Sigma; i y h ( i ) 2 &Sigma; i y ( i ) 2 公式27
其中,αh是比例缩放参数,yh(i)是谐波分量样值矢量yh中的第i个样值,y(i)是该帧的含噪声的语音信号的第i个样值。在公式27中,分子是谐波分量的每一样值的能量之和,分母是含噪声的语音信号的每一样值的能量之和。由此,比例缩放参数是该帧的谐波能量与该帧的总能量之比。
在替换实施例中,比例缩放参数使用概率有声-无声检测单元来设置。这一单元提供了语音的特定帧为有声而非无声的概率,这意味着该帧中的声带共振。帧来自语音的有声区域的概率可直接用作比例缩放参数。
在确定了比例缩放参数之后,或正在被确定时,在步骤1514确定谐波分量样值矢量和随机分量样值矢量的梅尔频谱。这涉及令每一样值矢量通过一离散傅立叶变换(DFT),以产生谐波分量频率值矢量1422和随机分量频率值矢量1420。由频率值矢量表示的功率谱然后由梅尔加权单元1424使用沿梅尔标度应用的一系列三角加权函数来平滑。这可得到谐波分量梅尔频谱矢量1428Yh和随机分量梅尔频谱矢量1426Yr
在步骤1516,将谐波分量和随机分量的梅尔频谱组合成加权和,以形成经降噪的梅尔频谱估算。这一步骤由加权和计算器1430使用以上确定的比例缩放因子在以下公式中执行:
X ^ ( t ) = &alpha; h ( t ) Y h ( t ) + &alpha; r Y r ( t ) 公式28
其中,
Figure C20051005287300193
是经降噪的梅尔频谱的估算,Yh(t)是谐波分量梅尔频谱,Yr(t)是随机分量梅尔频谱,αh(t)是以上确定的比例缩放因子,αr是随机分量的固定的比例缩放因子,在一个实施例中,它被设为1,时间下标t用于强调谐波分量的比例缩放因子是对每一帧确定的,而随机分量的比例缩放因子保持不变。注意,在其它实施例中,随机分量的比例缩放因子可对每一帧确定。
在步骤1516计算了经降噪的梅尔频谱之后,确定梅尔频谱的对数1432,然后在步骤1518将其应用于离散余弦变换1434。这产生了梅尔频率倒谱系统(MFCC)特征矢量1436,它表示经降噪的语音信号。
对含噪声的信号的每一帧产生一单独的经降噪的MFCC特征矢量。这些特征矢量可用于任何期望的目的,包括语音增强和语音识别。对于语音增强,MFCC特征矢量可被转换到功率谱域,并可用含噪声的气导信号来形成维纳滤波器。
尽管特别参照使用骨导传感器作为备选传感器来讨论本发明,然而可使用其它备选传感器。例如,在图16中,本发明的移动设备使用红外传感器1600,它一般瞄准用户的脸部,尤其是口部,并生成指示用户的面部运动中对应于语音的变化。由红外传感器1600生成的信号可用作上述技术中的备选传感器信号。
尽管参考特定的实施例描述了本发明,然而本领域的技术人员将认识到,可以在不脱离本发明的精神和范围的情况下在形式和细节上作出改变。

Claims (12)

1.一种移动手持式设备,其特征在于,包括:
一气导麦克风,它将声波转换成表示语音帧的电子麦克风信号;
两个骨导传感器,提供指示所述语音帧的第一和第二电子备选传感器信号,所述两个骨导传感器设置在所述移动手持式设备的扬声器的两侧;以及
一处理器,它使用所述麦克风信号和所述第一和第二备选电子传感器信号中强度较强的一个备选电子传感器信号来估算所述语音帧的干净语音值。
2.如权利要求1所述的移动手持式设备,其特征在于,它还包括一选择单元,它选择所述第一备选电子传感器信号和所述第二备选电子传感器信号之一。
3.如权利要求2所述的移动手持式设备,其特征在于,所述选择单元基于所述第一备选电子传感器信号和所述第二备选电子传感器信号的幅度,选择所述第一备选电子传感器信号和所述第二备选电子传感器信号之一。
4.如权利要求1所述的移动手持式设备,其特征在于,所述扬声器基于所述干净语音值中的噪声的量生成声音。
5.如权利要求1所述的移动手持式设备,其特征在于,它还包括一邻近传感器,它产生指示所述移动手持式设备和对象之间的距离的邻近信号。
6.如权利要求5所述的移动手持式设备,其特征在于,所述处理器基于所述麦克风信号、所述第一和第二备选电子传感器信号中强度较强的一个备选电子传感器信号和所述邻近信号确定所述干净语音值。
7.如权利要求5所述的移动手持式设备,其特征在于,所述扬声器基于所述邻近信号生成声音。
8.如权利要求1所述的移动手持式设备,其特征在于,所述两个骨导传感器之一包括一压力转换器,它液压地耦合至一用介质填充的衬垫。
9.如权利要求8所述的移动手持式设备,其特征在于,所述移动手持式设备具有左侧和所述左侧对面的右侧,并且其中,所述衬垫具有所述左侧上的第一部分和所述右侧上的第二部分。
10.如权利要求8所述的移动手持式设备,其特征在于,所述两个骨导传感器之一还提供一邻近信号。
11.如权利要求10所述的移动手持式设备,其特征在于,所述邻近信号包括由所述压力转换器产生的电信号的直流分量。
12.如权利要求11所述的移动手持式设备,其特征在于,所述第一和第二备选电子传感器信号包括由所述压力转换器产生的电信号的交流分量。
CN200510052873A 2004-02-24 2005-02-24 移动设备上多传感语音增强的装置 Active CN100583909C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/785,768 2004-02-24
US10/785,768 US7499686B2 (en) 2004-02-24 2004-02-24 Method and apparatus for multi-sensory speech enhancement on a mobile device

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2009100084006A Division CN101510905B (zh) 2004-02-24 2005-02-24 移动设备上多传感语音增强的方法和装置

Publications (2)

Publication Number Publication Date
CN1662018A CN1662018A (zh) 2005-08-31
CN100583909C true CN100583909C (zh) 2010-01-20

Family

ID=34750476

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200510052873A Active CN100583909C (zh) 2004-02-24 2005-02-24 移动设备上多传感语音增强的装置
CN2009100084006A Active CN101510905B (zh) 2004-02-24 2005-02-24 移动设备上多传感语音增强的方法和装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN2009100084006A Active CN101510905B (zh) 2004-02-24 2005-02-24 移动设备上多传感语音增强的方法和装置

Country Status (18)

Country Link
US (1) US7499686B2 (zh)
EP (1) EP1569422B1 (zh)
JP (1) JP4796309B2 (zh)
KR (1) KR101137181B1 (zh)
CN (2) CN100583909C (zh)
AU (1) AU2005200249A1 (zh)
BR (1) BRPI0500587A (zh)
CA (1) CA2494637C (zh)
EG (1) EG23701A (zh)
ES (1) ES2775799T3 (zh)
IL (1) IL166473A (zh)
MX (1) MXPA05002133A (zh)
NO (1) NO332636B1 (zh)
NZ (1) NZ537900A (zh)
RU (1) RU2376722C2 (zh)
SG (1) SG114686A1 (zh)
TW (1) TW200601798A (zh)
ZA (1) ZA200500691B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778909A (zh) * 2014-01-10 2014-05-07 瑞声科技(南京)有限公司 屏幕发声系统及其控制方法
TWI559784B (zh) * 2014-09-19 2016-11-21 和碩聯合科技股份有限公司 音訊裝置及音訊調校方法

Families Citing this family (125)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6675027B1 (en) * 1999-11-22 2004-01-06 Microsoft Corp Personal mobile computing device having antenna microphone for improved speech recognition
US7383181B2 (en) 2003-07-29 2008-06-03 Microsoft Corporation Multi-sensory speech detection system
US7447630B2 (en) 2003-11-26 2008-11-04 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7499686B2 (en) 2004-02-24 2009-03-03 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US8095073B2 (en) * 2004-06-22 2012-01-10 Sony Ericsson Mobile Communications Ab Method and apparatus for improved mobile station and hearing aid compatibility
US20060020454A1 (en) * 2004-07-21 2006-01-26 Phonak Ag Method and system for noise suppression in inductive receivers
US7574008B2 (en) 2004-09-17 2009-08-11 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7914468B2 (en) * 2004-09-22 2011-03-29 Svip 4 Llc Systems and methods for monitoring and modifying behavior
US7283850B2 (en) * 2004-10-12 2007-10-16 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US7983720B2 (en) * 2004-12-22 2011-07-19 Broadcom Corporation Wireless telephone with adaptive microphone array
US8509703B2 (en) * 2004-12-22 2013-08-13 Broadcom Corporation Wireless telephone with multiple microphones and multiple description transmission
US20070116300A1 (en) * 2004-12-22 2007-05-24 Broadcom Corporation Channel decoding for wireless telephones with multiple microphones and multiple description transmission
US20060135085A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone with uni-directional and omni-directional microphones
US20060133621A1 (en) * 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
US7483727B2 (en) * 2005-04-04 2009-01-27 Research In Motion Limited Mobile wireless communications device having improved antenna impedance match and antenna gain from RF energy
US7346504B2 (en) 2005-06-20 2008-03-18 Microsoft Corporation Multi-sensory speech enhancement using a clean speech prior
US7680656B2 (en) * 2005-06-28 2010-03-16 Microsoft Corporation Multi-sensory speech enhancement using a speech-state model
US7406303B2 (en) 2005-07-05 2008-07-29 Microsoft Corporation Multi-sensory speech enhancement using synthesized sensor signal
PL211141B1 (pl) * 2005-08-03 2012-04-30 Piotr Kleczkowski Sposób miksowania sygnałów dźwiękowych
WO2007028250A2 (en) * 2005-09-09 2007-03-15 Mcmaster University Method and device for binaural signal enhancement
US7930178B2 (en) * 2005-12-23 2011-04-19 Microsoft Corporation Speech modeling and enhancement based on magnitude-normalized spectra
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8194880B2 (en) * 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
FR2899372B1 (fr) * 2006-04-03 2008-07-18 Adeunis Rf Sa Systeme de communication audio sans fil
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
EP2038885A1 (en) * 2006-05-31 2009-03-25 Agere Systems Inc. Noise reduction by mobile communication devices in non-call situations
US8364492B2 (en) * 2006-07-13 2013-01-29 Nec Corporation Apparatus, method and program for giving warning in connection with inputting of unvoiced speech
US20080175408A1 (en) * 2007-01-20 2008-07-24 Shridhar Mukund Proximity filter
US7734247B2 (en) * 2007-01-25 2010-06-08 Sony Ericsson Mobile Communications Ab Configurable serial memory interface
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US8068620B2 (en) * 2007-03-01 2011-11-29 Canon Kabushiki Kaisha Audio processing apparatus
US7925502B2 (en) * 2007-03-01 2011-04-12 Microsoft Corporation Pitch model for noise estimation
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8631358B2 (en) * 2007-10-10 2014-01-14 Apple Inc. Variable device graphical user interface
US8428661B2 (en) * 2007-10-30 2013-04-23 Broadcom Corporation Speech intelligibility in telephones with multiple microphones
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8676224B2 (en) 2008-02-19 2014-03-18 Apple Inc. Speakerphone control for mobile device
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8280732B2 (en) * 2008-03-27 2012-10-02 Wolfgang Richter System and method for multidimensional gesture analysis
PL2301017T3 (pl) * 2008-05-09 2017-05-31 Nokia Technologies Oy Urządzenie akustyczne
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8218397B2 (en) 2008-10-24 2012-07-10 Qualcomm Incorporated Audio source proximity estimation using sensor array for noise reduction
JP5299030B2 (ja) * 2009-03-31 2013-09-25 ソニー株式会社 ヘッドホン装置
US9009039B2 (en) * 2009-06-12 2015-04-14 Microsoft Technology Licensing, Llc Noise adaptive training for speech recognition
WO2011047285A1 (en) 2009-10-16 2011-04-21 University Of Virginia Patent Foundation Gas-expanded lubricants for increased energy efficiency and related method and system
US8213664B2 (en) 2009-10-30 2012-07-03 Research In Motion Limited Shape-adaptable surface for an audio port
EP2326105B1 (en) * 2009-10-30 2011-10-26 Research in Motion Limited A shape-adaptable surface for an audio port
EP3550853A1 (en) * 2009-11-24 2019-10-09 Nokia Technologies Oy An apparatus
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9123323B2 (en) * 2010-06-04 2015-09-01 John P. Keady Method and structure for inducing acoustic signals and attenuating acoustic signals
US8761421B2 (en) 2011-01-14 2014-06-24 Audiotoniq, Inc. Portable electronic device and computer-readable medium for remote hearing aid profile storage
WO2011159349A1 (en) 2010-06-14 2011-12-22 Audiotoniq, Inc. Hearing aid system
US9167339B2 (en) 2010-07-07 2015-10-20 Iii Holdings 4, Llc Hearing damage limiting headphones
US8731923B2 (en) * 2010-08-20 2014-05-20 Adacel Systems, Inc. System and method for merging audio data streams for use in speech recognition applications
TWI486068B (zh) 2010-09-13 2015-05-21 Htc Corp 行動電子裝置與其聲音播放方法
US8515110B2 (en) 2010-09-30 2013-08-20 Audiotoniq, Inc. Hearing aid with automatic mode change capabilities
US10687150B2 (en) 2010-11-23 2020-06-16 Audiotoniq, Inc. Battery life monitor system and method
EP2458586A1 (en) * 2010-11-24 2012-05-30 Koninklijke Philips Electronics N.V. System and method for producing an audio signal
BR112013012539B1 (pt) * 2010-11-24 2021-05-18 Koninklijke Philips N.V. método para operar um dispositivo e dispositivo
KR101500823B1 (ko) * 2010-11-25 2015-03-09 고어텍 인크 음성 향상 방법, 장치 및 노이즈 감소 통신 헤드셋
US8918149B2 (en) 2010-12-27 2014-12-23 Rohm Co., Ltd. Mobile telephone
EP3767926A3 (en) * 2010-12-27 2021-03-24 FINEWELL Co., Ltd. Incoming-talk unit
US9313306B2 (en) 2010-12-27 2016-04-12 Rohm Co., Ltd. Mobile telephone cartilage conduction unit for making contact with the ear cartilage
JP5902416B2 (ja) * 2011-08-19 2016-04-13 株式会社ファインウェル 携帯電話
JP5911248B2 (ja) * 2011-09-22 2016-04-27 株式会社ファインウェル 携帯電話
JP5783352B2 (ja) 2011-02-25 2015-09-24 株式会社ファインウェル 会話システム、会話システム用指輪、携帯電話用指輪、指輪型携帯電話、及び、音声聴取方法
EP2509337B1 (en) * 2011-04-06 2014-09-24 Sony Ericsson Mobile Communications AB Accelerometer vector controlled noise cancelling method
US8909524B2 (en) * 2011-06-07 2014-12-09 Analog Devices, Inc. Adaptive active noise canceling for handset
JP5731362B2 (ja) * 2011-11-28 2015-06-10 京セラ株式会社 電子機器
CN106879080B (zh) 2012-01-20 2020-09-29 株式会社精好 移动电话、软骨传导振动源装置、聆听装置、通话装置
US20140364171A1 (en) * 2012-03-01 2014-12-11 DSP Group Method and system for improving voice communication experience in mobile communication devices
WO2013164999A1 (ja) * 2012-05-01 2013-11-07 京セラ株式会社 電子機器、制御方法及び制御プログラム
TWI645722B (zh) 2012-06-29 2018-12-21 日商精良股份有限公司 mobile phone
US9094749B2 (en) 2012-07-25 2015-07-28 Nokia Technologies Oy Head-mounted sound capture device
US9313572B2 (en) 2012-09-28 2016-04-12 Apple Inc. System and method of detecting a user's voice activity using an accelerometer
US9438985B2 (en) 2012-09-28 2016-09-06 Apple Inc. System and method of detecting a user's voice activity using an accelerometer
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9363596B2 (en) 2013-03-15 2016-06-07 Apple Inc. System and method of mixing accelerometer and microphone signals to improve voice quality in a mobile device
KR102282366B1 (ko) 2013-06-03 2021-07-27 삼성전자주식회사 음성 향상 방법 및 그 장치
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
KR101972290B1 (ko) 2013-08-23 2019-04-24 파인웰 씨오., 엘티디 휴대 전화
KR102079893B1 (ko) 2013-10-24 2020-02-20 파인웰 씨오., 엘티디 팔찌형 송수화 장치, 팔찌형 통지 장치
US9547175B2 (en) 2014-03-18 2017-01-17 Google Inc. Adaptive piezoelectric array for bone conduction receiver in wearable computers
JP6551919B2 (ja) 2014-08-20 2019-07-31 株式会社ファインウェル 見守りシステム、見守り検知装置および見守り通報装置
JP6446913B2 (ja) * 2014-08-27 2019-01-09 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
WO2016033364A1 (en) 2014-08-28 2016-03-03 Audience, Inc. Multi-sourced noise suppression
JP5951738B2 (ja) * 2014-12-01 2016-07-13 株式会社ファインウェル 振動素子およびこれを用いた携帯電話
KR101973486B1 (ko) 2014-12-18 2019-04-29 파인웰 씨오., 엘티디 전자형 진동 유닛을 사용한 연골 전도 청취 장치 및 전자형 진동 유닛
TWI566742B (zh) 2015-02-26 2017-01-21 華邦電子股份有限公司 分析處理裝置
TWI552004B (zh) 2015-03-12 2016-10-01 國立交通大學 信號分解方法及其電子裝置
GB2538853B (en) 2015-04-09 2018-09-19 Dolby Laboratories Licensing Corp Switching to a second audio interface between a computer apparatus and an audio apparatus
KR102372188B1 (ko) * 2015-05-28 2022-03-08 삼성전자주식회사 오디오 신호의 잡음을 제거하기 위한 방법 및 그 전자 장치
US9847093B2 (en) * 2015-06-19 2017-12-19 Samsung Electronics Co., Ltd. Method and apparatus for processing speech signal
WO2017010547A1 (ja) 2015-07-15 2017-01-19 ローム株式会社 ロボットおよびロボットシステム
JP6551929B2 (ja) 2015-09-16 2019-07-31 株式会社ファインウェル 受話機能を有する腕時計
US10165362B2 (en) 2015-12-24 2018-12-25 Intel Corporation Automated equalization
CN108496345B (zh) 2016-01-19 2021-02-26 株式会社精好 笔型呼入呼出通话装置
JP6178884B2 (ja) * 2016-01-27 2017-08-09 株式会社ファインウェル 携帯電話
US10319377B2 (en) * 2016-03-15 2019-06-11 Tata Consultancy Services Limited Method and system of estimating clean speech parameters from noisy speech parameters
JP6096962B2 (ja) * 2016-03-29 2017-03-15 株式会社ファインウェル 携帯電話
CN107071652B (zh) * 2016-12-27 2023-08-04 深圳市优必选科技有限公司 一种服务机器人
CN106792354A (zh) * 2016-12-27 2017-05-31 广东小天才科技有限公司 一种可穿戴设备的播放模式控制方法及可穿戴设备
CN106686494A (zh) * 2016-12-27 2017-05-17 广东小天才科技有限公司 一种可穿戴设备的语音输入控制方法及可穿戴设备
CN106850963A (zh) * 2016-12-27 2017-06-13 广东小天才科技有限公司 一种可穿戴设备的通话控制方法及可穿戴设备
US10614788B2 (en) 2017-03-15 2020-04-07 Synaptics Incorporated Two channel headset-based own voice enhancement
US10135822B2 (en) 2017-03-21 2018-11-20 YouaretheID, LLC Biometric authentication of individuals utilizing characteristics of bone and blood vessel structures
CN107910011B (zh) * 2017-12-28 2021-05-04 科大讯飞股份有限公司 一种语音降噪方法、装置、服务器及存储介质
US11600273B2 (en) 2018-02-14 2023-03-07 Nec Corporation Speech processing apparatus, method, and program
JP2020053948A (ja) 2018-09-28 2020-04-02 株式会社ファインウェル 聴取装置
CN110058689A (zh) * 2019-04-08 2019-07-26 深圳大学 一种基于脸部振动的智能设备输入方法
JP2022547525A (ja) 2019-09-12 2022-11-14 シェンチェン ショックス カンパニー リミテッド 音声信号を生成するためのシステム及び方法
CN110931031A (zh) * 2019-10-09 2020-03-27 大象声科(深圳)科技有限公司 一种融合骨振动传感器和麦克风信号的深度学习语音提取和降噪方法
CN111327985A (zh) * 2020-03-06 2020-06-23 华勤通讯技术有限公司 一种耳机降噪方法和装置
CN113205824B (zh) * 2021-04-30 2022-11-11 紫光展锐(重庆)科技有限公司 声音信号处理方法、装置、存储介质、芯片及相关设备

Family Cites Families (108)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2761800A (en) * 1955-05-02 1956-09-04 Rca Corp Method of forming p-n junctions in n-type germanium
US3383466A (en) * 1964-05-28 1968-05-14 Navy Usa Nonacoustic measures in automatic speech recognition
US3746789A (en) * 1971-10-20 1973-07-17 E Alcivar Tissue conduction microphone utilized to activate a voice operated switch
US3787641A (en) * 1972-06-05 1974-01-22 Setcom Corp Bone conduction microphone assembly
JPS5756624Y2 (zh) * 1979-04-20 1982-12-06
US4382164A (en) * 1980-01-25 1983-05-03 Bell Telephone Laboratories, Incorporated Signal stretcher for envelope generator
JPS62239231A (ja) * 1986-04-10 1987-10-20 Kiyarii Rabo:Kk 口唇画像入力による音声認識方法
JPH0755167B2 (ja) * 1988-09-21 1995-06-14 松下電器産業株式会社 移動体
JPH03108997A (ja) 1989-09-22 1991-05-09 Temuko Japan:Kk 骨伝導マイク
JPH03160851A (ja) * 1989-11-20 1991-07-10 Fujitsu Ltd 携帯電話機
US5054079A (en) * 1990-01-25 1991-10-01 Stanton Magnetics, Inc. Bone conduction microphone with mounting means
US5404577A (en) * 1990-07-13 1995-04-04 Cairns & Brother Inc. Combination head-protective helmet & communications system
US5295193A (en) * 1992-01-22 1994-03-15 Hiroshi Ono Device for picking up bone-conducted sound in external auditory meatus and communication device using the same
US5590241A (en) * 1993-04-30 1996-12-31 Motorola Inc. Speech processing system and method for enhancing a speech signal in a noisy environment
US5446789A (en) * 1993-11-10 1995-08-29 International Business Machines Corporation Electronic device having antenna for receiving soundwaves
JPH0739150U (ja) * 1993-12-14 1995-07-14 アツデン株式会社 携帯用電話機
AU684872B2 (en) * 1994-03-10 1998-01-08 Cable And Wireless Plc Communication system
US5828768A (en) * 1994-05-11 1998-10-27 Noise Cancellation Technologies, Inc. Multimedia personal computer with active noise reduction and piezo speakers
EP0984660B1 (en) * 1994-05-18 2003-07-30 Nippon Telegraph and Telephone Corporation Transmitter-receiver having ear-piece type acoustic transducer part
JPH08186654A (ja) 1994-12-22 1996-07-16 Internatl Business Mach Corp <Ibm> 携帯端末装置
JP3453898B2 (ja) * 1995-02-17 2003-10-06 ソニー株式会社 音声信号の雑音低減方法及び装置
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
US5692059A (en) * 1995-02-24 1997-11-25 Kruger; Frederick M. Two active element in-the-ear microphone system
US5555449A (en) * 1995-03-07 1996-09-10 Ericsson Inc. Extendible antenna and microphone for portable communication unit
JP3264822B2 (ja) * 1995-04-05 2002-03-11 三菱電機株式会社 移動体通信機器
US5651074A (en) 1995-05-11 1997-07-22 Lucent Technologies Inc. Noise canceling gradient microphone assembly
KR960042590A (ko) * 1995-05-23 1996-12-21 김광호 테이프 재생용 음량기기에서의 발음비교방법
JP3591068B2 (ja) * 1995-06-30 2004-11-17 ソニー株式会社 音声信号の雑音低減方法
US5647834A (en) * 1995-06-30 1997-07-15 Ron; Samuel Speech-based biofeedback method and system
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
JPH09172479A (ja) * 1995-12-20 1997-06-30 Yokoi Kikaku:Kk 送受話器およびそれを用いた通話装置
US6377919B1 (en) * 1996-02-06 2002-04-23 The Regents Of The University Of California System and method for characterizing voiced excitations of speech and acoustic signals, removing acoustic noise from speech, and synthesizing speech
US6006175A (en) * 1996-02-06 1999-12-21 The Regents Of The University Of California Methods and apparatus for non-acoustic speech characterization and recognition
US6243596B1 (en) * 1996-04-10 2001-06-05 Lextron Systems, Inc. Method and apparatus for modifying and integrating a cellular phone with the capability to access and browse the internet
JPH09284877A (ja) * 1996-04-19 1997-10-31 Toyo Commun Equip Co Ltd マイクシステム
US5943627A (en) * 1996-09-12 1999-08-24 Kim; Seong-Soo Mobile cellular phone
JPH10261910A (ja) 1997-01-16 1998-09-29 Sony Corp 携帯無線装置およびアンテナ装置
JP2874679B2 (ja) * 1997-01-29 1999-03-24 日本電気株式会社 雑音消去方法及びその装置
JPH10224253A (ja) * 1997-02-10 1998-08-21 Sony Corp 携帯通信機
US6308062B1 (en) * 1997-03-06 2001-10-23 Ericsson Business Networks Ab Wireless telephony system enabling access to PC based functionalities
FR2761800A1 (fr) 1997-04-02 1998-10-09 Scanera Sc Dispositif de transmission de voix et telephone le mettant en oeuvre
US5983073A (en) * 1997-04-04 1999-11-09 Ditzik; Richard J. Modular notebook and PDA computer systems for personal computing and wireless communications
US6175633B1 (en) * 1997-04-09 2001-01-16 Cavcom, Inc. Radio communications apparatus with attenuating ear pieces for high noise environments
US6151397A (en) * 1997-05-16 2000-11-21 Motorola, Inc. Method and system for reducing undesired signals in a communication environment
JP3548380B2 (ja) * 1997-05-30 2004-07-28 アイホン株式会社 ドアホン子機
US5924065A (en) * 1997-06-16 1999-07-13 Digital Equipment Corporation Environmently compensated speech processing
US6434239B1 (en) * 1997-10-03 2002-08-13 Deluca Michael Joseph Anti-sound beam method and apparatus
JPH11249692A (ja) 1998-02-27 1999-09-17 Nec Saitama Ltd 音声認識装置
DE69936476T2 (de) 1998-03-18 2007-11-08 Nippon Telegraph And Telephone Corp. Tragbares Kommunikationsgerät zur Eingabe von Befehlen durch Detektion der Fingeraufschläge oder Vibrationen der Fingerspitzen
AU763861B2 (en) * 1998-05-19 2003-07-31 Spectrx, Inc. Apparatus and method for determining tissue characteristics
US6717991B1 (en) * 1998-05-27 2004-04-06 Telefonaktiebolaget Lm Ericsson (Publ) System and method for dual microphone signal noise reduction using spectral subtraction
US6052464A (en) * 1998-05-29 2000-04-18 Motorola, Inc. Telephone set having a microphone for receiving or an earpiece for generating an acoustic signal via a keypad
US6137883A (en) * 1998-05-30 2000-10-24 Motorola, Inc. Telephone set having a microphone for receiving an acoustic signal via keypad
JP3160714B2 (ja) * 1998-07-08 2001-04-25 株式会社シコー技研 携帯無線通信機
US6292674B1 (en) * 1998-08-05 2001-09-18 Ericsson, Inc. One-handed control for wireless telephone
JP3893763B2 (ja) * 1998-08-17 2007-03-14 富士ゼロックス株式会社 音声検出装置
US6760600B2 (en) * 1999-01-27 2004-07-06 Gateway, Inc. Portable communication apparatus
JP2000250577A (ja) * 1999-02-24 2000-09-14 Nippon Telegr & Teleph Corp <Ntt> 音声認識装置及び同装置に使用される学習方法ならびに学習装置及び同方法がプログラムされ記録された記録媒体
DE19917169A1 (de) 1999-04-16 2000-11-02 Kamecke Keller Orla Verfahren zur Speicherung und Wiedergabe von Audio-, Video- und Anwendungsprogrammdaten in Mobilfunkendgeräten
US6738485B1 (en) * 1999-05-10 2004-05-18 Peter V. Boesen Apparatus, method and system for ultra short range communication
US20020057810A1 (en) * 1999-05-10 2002-05-16 Boesen Peter V. Computer and voice communication unit with handsfree device
US6542721B2 (en) * 1999-10-11 2003-04-01 Peter V. Boesen Cellular telephone, personal digital assistant and pager unit
US6952483B2 (en) * 1999-05-10 2005-10-04 Genisus Systems, Inc. Voice transmission apparatus with UWB
US6560468B1 (en) * 1999-05-10 2003-05-06 Peter V. Boesen Cellular telephone, personal digital assistant, and pager unit with capability of short range radio frequency transmissions
US6094492A (en) * 1999-05-10 2000-07-25 Boesen; Peter V. Bone conduction voice transmission apparatus and system
JP2001016057A (ja) * 1999-07-01 2001-01-19 Matsushita Electric Ind Co Ltd 音響装置
US6594629B1 (en) * 1999-08-06 2003-07-15 International Business Machines Corporation Methods and apparatus for audio-visual speech detection and recognition
US6603823B1 (en) * 1999-11-12 2003-08-05 Intel Corporation Channel estimator
US6339706B1 (en) * 1999-11-12 2002-01-15 Telefonaktiebolaget L M Ericsson (Publ) Wireless voice-activated remote control device
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US6675027B1 (en) * 1999-11-22 2004-01-06 Microsoft Corp Personal mobile computing device having antenna microphone for improved speech recognition
US6411933B1 (en) * 1999-11-22 2002-06-25 International Business Machines Corporation Methods and apparatus for correlating biometric attributes and biometric attribute production features
GB2357400A (en) * 1999-12-17 2001-06-20 Nokia Mobile Phones Ltd Controlling a terminal of a communication system
JP4472823B2 (ja) * 2000-02-04 2010-06-02 パナソニック株式会社 クロマトグラフィー試験片、及びその製造方法
US20030179888A1 (en) * 2002-03-05 2003-09-25 Burnett Gregory C. Voice activity detection (VAD) devices and methods for use with noise suppression systems
JP3339579B2 (ja) * 2000-10-04 2002-10-28 株式会社鷹山 電話装置
KR100394840B1 (ko) * 2000-11-30 2003-08-19 한국과학기술원 독립 성분 분석을 이용한 능동 잡음 제거방법
US6853850B2 (en) * 2000-12-04 2005-02-08 Mobigence, Inc. Automatic speaker volume and microphone gain control in a portable handheld radiotelephone with proximity sensors
US20020075306A1 (en) * 2000-12-18 2002-06-20 Christopher Thompson Method and system for initiating communications with dispersed team members from within a virtual team environment using personal identifiers
US6985858B2 (en) * 2001-03-20 2006-01-10 Microsoft Corporation Method and apparatus for removing noise from feature vectors
GB2375276B (en) 2001-05-03 2003-05-28 Motorola Inc Method and system of sound processing
US6987986B2 (en) * 2001-06-21 2006-01-17 Boesen Peter V Cellular telephone, personal digital assistant with dual lines for simultaneous uses
JP3699018B2 (ja) * 2001-07-25 2005-09-28 埼玉日本電気株式会社 電話機の自動音量調整装置
US7054423B2 (en) * 2001-09-24 2006-05-30 Nebiker Robert M Multi-media communication downloading
US6959276B2 (en) * 2001-09-27 2005-10-25 Microsoft Corporation Including the category of environmental noise when processing speech signals
US6952482B2 (en) * 2001-10-02 2005-10-04 Siemens Corporation Research, Inc. Method and apparatus for noise filtering
JP3532544B2 (ja) * 2001-10-30 2004-05-31 株式会社テムコジャパン 面体又は帽体のストラップ装着用送受話装置
JP3678694B2 (ja) * 2001-11-02 2005-08-03 Necビューテクノロジー株式会社 対話型端末装置、その通話制御方法、およびそのプログラム
US7162415B2 (en) * 2001-11-06 2007-01-09 The Regents Of The University Of California Ultra-narrow bandwidth voice coding
US6707921B2 (en) * 2001-11-26 2004-03-16 Hewlett-Packard Development Company, Lp. Use of mouth position and mouth movement to filter noise from speech in a hearing aid
DE10158583A1 (de) * 2001-11-29 2003-06-12 Philips Intellectual Property Verfahren zum Betrieb eines Barge-In-Dialogsystems
US6664713B2 (en) * 2001-12-04 2003-12-16 Peter V. Boesen Single chip device for voice communications
US7219062B2 (en) * 2002-01-30 2007-05-15 Koninklijke Philips Electronics N.V. Speech activity detection using acoustic and facial characteristics in an automatic speech recognition system
US9374451B2 (en) 2002-02-04 2016-06-21 Nokia Technologies Oy System and method for multimodal short-cuts to digital services
US7117148B2 (en) * 2002-04-05 2006-10-03 Microsoft Corporation Method of noise reduction using correction vectors based on dynamic aspects of speech and noise normalization
US7190797B1 (en) * 2002-06-18 2007-03-13 Plantronics, Inc. Headset with foldable noise canceling and omnidirectional dual-mode boom
GB2421668B (en) 2002-06-24 2007-01-03 Samsung Electronics Co Ltd Usage position detection
EP1547434B8 (en) * 2002-07-26 2012-03-07 Oakley, Inc. Wireless interactive headset
US7092529B2 (en) * 2002-11-01 2006-08-15 Nanyang Technological University Adaptive control system for noise cancellation
WO2004068464A2 (en) * 2003-01-30 2004-08-12 Aliphcom, Inc. Acoustic vibration sensor
US7593851B2 (en) * 2003-03-21 2009-09-22 Intel Corporation Precision piecewise polynomial approximation for Ephraim-Malah filter
US20060008256A1 (en) * 2003-10-01 2006-01-12 Khedouri Robert K Audio visual player apparatus and system and method of content distribution using the same
US7447630B2 (en) * 2003-11-26 2008-11-04 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
US7499686B2 (en) 2004-02-24 2009-03-03 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device
US8095073B2 (en) * 2004-06-22 2012-01-10 Sony Ericsson Mobile Communications Ab Method and apparatus for improved mobile station and hearing aid compatibility
US7574008B2 (en) * 2004-09-17 2009-08-11 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement
US7283850B2 (en) * 2004-10-12 2007-10-16 Microsoft Corporation Method and apparatus for multi-sensory speech enhancement on a mobile device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778909A (zh) * 2014-01-10 2014-05-07 瑞声科技(南京)有限公司 屏幕发声系统及其控制方法
TWI559784B (zh) * 2014-09-19 2016-11-21 和碩聯合科技股份有限公司 音訊裝置及音訊調校方法

Also Published As

Publication number Publication date
BRPI0500587A (pt) 2005-10-18
KR20050086378A (ko) 2005-08-30
US20050185813A1 (en) 2005-08-25
SG114686A1 (en) 2005-09-28
EP1569422A2 (en) 2005-08-31
NZ537900A (en) 2006-08-31
AU2005200249A1 (en) 2005-09-08
MXPA05002133A (es) 2005-12-05
CN101510905A (zh) 2009-08-19
EG23701A (en) 2007-05-22
NO332636B1 (no) 2012-11-26
RU2005104970A (ru) 2006-08-10
US7499686B2 (en) 2009-03-03
EP1569422A3 (en) 2007-08-29
CA2494637C (en) 2013-09-03
NO20050986L (no) 2005-08-25
CN101510905B (zh) 2011-03-09
KR101137181B1 (ko) 2012-04-19
TW200601798A (en) 2006-01-01
JP4796309B2 (ja) 2011-10-19
EP1569422B1 (en) 2019-11-13
RU2376722C2 (ru) 2009-12-20
CA2494637A1 (en) 2005-08-24
ZA200500691B (en) 2007-03-28
JP2005244968A (ja) 2005-09-08
NO20050986D0 (no) 2005-02-23
IL166473A (en) 2010-12-30
ES2775799T3 (es) 2020-07-28
IL166473A0 (en) 2006-01-15
CN1662018A (zh) 2005-08-31

Similar Documents

Publication Publication Date Title
CN100583909C (zh) 移动设备上多传感语音增强的装置
CN1622200B (zh) 多传感语音增强方法和装置
US6691090B1 (en) Speech recognition system including dimensionality reduction of baseband frequency signals
US7620546B2 (en) Isolating speech signals utilizing neural networks
CN104700843A (zh) 一种年龄识别的方法及装置
KR20080023030A (ko) 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치
CN110946554A (zh) 咳嗽类型识别方法、装置及系统
Flynn et al. Robust distributed speech recognition using speech enhancement
Ding Speech enhancement in transform domain
Mital Speech enhancement for automatic analysis of child-centered audio recordings
Cooper Speech detection using gammatone features and one-class support vector machine
CN115691473A (zh) 一种语音端点检测方法、装置和存储介质
Levin Blind normalization of speech from different channels
Naruka et al. Voice Operated Wheelchair for Physically Disabled
JPH0887293A (ja) 音声検出方法および音声検出マイクロフォン

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150429

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150429

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160801

Address after: Grand Cayman, Georgetown, Cayman Islands

Patentee after: IValley Holding Co., Ltd.

Address before: Washington State

Patentee before: Micro soft technique license Co., Ltd