CN1655233B - 实现语音对话的方法及其语音对话系统 - Google Patents

实现语音对话的方法及其语音对话系统 Download PDF

Info

Publication number
CN1655233B
CN1655233B CN2005100542203A CN200510054220A CN1655233B CN 1655233 B CN1655233 B CN 1655233B CN 2005100542203 A CN2005100542203 A CN 2005100542203A CN 200510054220 A CN200510054220 A CN 200510054220A CN 1655233 B CN1655233 B CN 1655233B
Authority
CN
China
Prior art keywords
voice dialogue
dialogue
voice
user
electronic equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2005100542203A
Other languages
English (en)
Other versions
CN1655233A (zh
Inventor
B·耶施克
F·雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daimler Benz AG
Daimler AG
Harman Becker Automotive Systems GmbH
Original Assignee
Daimler Benz AG
Harman Becker Automotive Systems GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daimler Benz AG, Harman Becker Automotive Systems GmbH filed Critical Daimler Benz AG
Publication of CN1655233A publication Critical patent/CN1655233A/zh
Application granted granted Critical
Publication of CN1655233B publication Critical patent/CN1655233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L23/00Cleaning footwear
    • A47L23/22Devices or implements resting on the floor for removing mud, dirt, or dust from footwear
    • A47L23/24Rigid cleaning-gratings; Tread plates or scrapers for cleaning the soles of footwear
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60NSEATS SPECIALLY ADAPTED FOR VEHICLES; VEHICLE PASSENGER ACCOMMODATION NOT OTHERWISE PROVIDED FOR
    • B60N3/00Arrangements or adaptations of other passenger fittings, not otherwise provided for
    • B60N3/04Arrangements or adaptations of other passenger fittings, not otherwise provided for of floor mats or carpets
    • B60N3/048Arrangements or adaptations of other passenger fittings, not otherwise provided for of floor mats or carpets characterised by their structure
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Abstract

本发明涉及一种特别是在车辆环境中用于在语音对话系统和用户之间实现语音对话,以控制至少一个电子设备的方法,该方法包括以下步骤:通过SDS(18)根据预定的暂停命令的接收来中断语音对话,以及通过SDS根据预定的继续命令的接收来继续语音对话。本发明还涉及一种语音对话系统,该系统包括用于中断语音对话的装置和用于继续所中断的语音对话的装置。

Description

实现语音对话的方法及其语音对话系统
技术领域
本发明涉及一种用于在语音对话系统(SDS)和用于控制至少一个电子设备的用户之间实现语音对话的方法,还涉及与用于与控制至少一个电子设备的用户实现语音对话的语音对话系统(SDS)。 
背景技术
语音对话系统表示在用户和机器或电子设备之间的界面,借此用户能够通过给SDS语音命令来控制机器,所述SDS分析语音命令和提取出控制命令,所述控制命令将依次传送给机器或电子设备。通常由这样的SDS和用户实现的语音对话包括以下步骤:由SDS输出用于声输入的请求、等待用户的语音输入以及接收来自用户的语音输入。为了实现完整的语音对话,那么就要按需要多次重复上述步骤,从而将用户所希望给出的所有控制命令提供给由SDS控制的机器或电子设备。这样的SDS例如是在汽车中使用,它们对用户控制其车辆的至少一些电子设备提供可能,例如收音机、导航系统或者气候(climate)控制,而不用被迫将其注意力移开驾驶。 
然而现有技术的SDS存在以下问题。在SDS口头输入的请求之后提示用户和等待输入。如果由于用户忙别的事而没有给出所等待的输入,例如他必须全神贯注驾驶,SDS就停止等待语音输入和关闭该程序。这样就会丢失从用户接收的已经给出的信息,如果用户希望继续其行动时就必须再次开始该程序。 
发明内容
因此,本发明的目的是提供一种在SDS和用户之间实现语音对话的方法,以及提供一种能够克服上述问题的SDS,由此提供一种更舒适的实现语音对话的方法和SDS。 
所述目的是通过实现语音对话的方法和SDS来实现的。 
因此提供了一种尤其在车辆环境中用于在语音对话系统(SDS)和用户之间实现语音对话以控制至少一个电子设备的方法,包括以下步骤: 
通过SDS,基于预定的暂停命令的接收来中断所述语音对话; 
以及通过SDS,基于预定的继续命令的接收来继续所述语音对话或者通过SDS基于预定的取消命令的接收来取消所述语音对话。 
因此使用本发明的方法,能够在任意时间中断语音对话以及在随后的点及时继续该对话。这里的术语“继续”意思是所述语音对话不是从开始重新启动的,而是,例如就是一些先前由用户提供的语音输入对SDS仍然是可用的,例如存储在内部存储装置中,因此对于SDS来说就不需要再次请求在中断之前的所有这些输入。最终,代替继续,用户还可以请求取消所启动的和之后所中断的语音对话。 
根据本发明的实现语音对话的优选实施例,继续所述语音对话的步骤可以包括部分语音对话的重复。实际上,所述语音对话还可以准确地在其所中断的位置上继续,但也可以在更有利的情况下去重复部分语音对话。 
例如,通过重复部分语音对话,用户能够从SDS接收有关他的/她的在中断之前所输入的信息,因此他/她能够容易地继续所述语音对话。所述SDS能够使用光学上例如显示器和/或声学上提供所述信息。 
而且,可以想象的是语音对话被分成几个逻辑单元,例如当所述语音对话是有关给导航系统输入地址时,所述逻辑单元可以第一是城市、第二是街区和街区号码。对于这样的语音对话,有利的是在中断所述语音对话之后,依靠中断发生的地方以其中一个逻辑单元的开始来继续所述语音对话。在所给的例子中,如果是在第二逻辑单元,已经给出了所述街区名称但没有给出其号码,所述语音对话将继续再次询问用户该街区的名称。通过重复部分语音对话,用户能够容易地继续其输入而不必记住其早前已经输入的所有细节。 
根据另一个优选实施例,所述继续所述语音对话的步骤可以包括由SDS输出在中断所述语音对话之前SDS的至少最后一个输出,和/或由SDS输出在中断所述语音对话之前从用户接收的至少最后一个输入,和/或由SDS等待用户的语音输入,特别是基于来自用户的相应命令的接收。 
通过提供这个特征,还可以帮助用户想起所述语音对话所中断的位置。所述SDS例如能够重复对于语音输入的最后请求和相应的所接收的语音输入、然后继续语音输入的随后的请求,或者还可能是所述SDS重复所有已经提供的语音输入,然后重复最后的请求或继续语音输入的下一个请求。在另一种变化中,在重复了已经提供的语音输入和语音输入的最后一个请求之后,所述SDS等待用户相应的语音输入。 
另外,用户能够从SDS中请求信息,其能够帮助用户回想起所述语音对话中断的地方和/或他/她已经给出的信息类型。 
由此,由于所述SDS提供有关语音对话中断的地方和/或用户已经提供给SDS的信息类型的信息,提高了SDS的用户友好性。 
在特别有利的实施例中,继续所述语音对话的步骤可以包括通知用户所中断的语音对话继续。这意味着由SDS给用户特定的继续输出,以通知用户随后将继续早先被中断的语音对话。这样就再次提高了SDS的用户友好性。 
在优选实施例中,所述中断和/或继续所述语音对话的步骤可以通过SDS依据用户相应的声学或触觉命令的接收或者依据电子设备的相应命令的接收来实现。其中,最后不受所述SDS控制的电子设备能够为所述SDS提供暂停或继续命令。 
由此所述语音对话可以由电子设备中断,但另一方面也可以由用户的操作中断。例如,如果交通变得很密集以及因此用户较高的注意力变得必要,那么用户可以给出如“暂停”的语音命令或者其还可以操作语音对话系统的控制键来中断所述对话。如果随后用户想继续所中断的语音对话,那么再次如“继续”的语音命令或者SDS的控制键的操作将使得所述语音对话继续。由于这么高数量的中断或继续所述语音对话的可能性,再次提高了所述的用户友好性。 
根据有利的实施例,本发明的方法还可以包括在第一个语音对话中断期间启动另一个语音对话,尤其用于控制不同的电子设备。在上述对导航系统的新目标位置的输入被来电呼叫所中断的例子中,可以想到在电话谈话期间,用户希望存储新地址或电话号码到其电话中,由此使用本发明的方法,用户就有可能使用所述语音对话系统存储这个新地址或电话号码,甚至是在已经存在第一个被中断的语音对话的情况下。由于存在这个可能性,因此用户就不必关注是否已经存在一个被中断的语音对话。 
根据另一个优选实施例,所述继续其中一个已中断的语音对话的步骤可以包括通知用户所继续的语音对话,特别地,通过输出由所述语音对话控制的电子设备的标识符。对于已经中断几个语音对话和用户继续其中一个语音对话的情况,有利的是所述SDS通知用户有关哪个语音对话将要继续。这例如可以通过宣布至少将要由所述语音对话控制的电子设备的名称来完成。这样用户就不需要担心哪个类型的语音对话仍然被中断以及哪个语音对话将要被继续。 
在特别有利的实施例中,本发明的方法可以包括显示已中断的语音对话的标识符的步骤,特别是,在所述语音对话中断期间由所述语音对话控制的电子设备的名称。所述SDS可以连接到一个显示器上或者所述显示器可以是所述SDS的组成部分,并且在语音对话中断期间该显示器用于保持给用户通知目前哪个语音对话被中断。这再一次帮助用户知道哪个语音对话被中断和哪个语音对话可以被继续。 
在一种变形中,本发明的方法可以包括在相应的语音对话中断期间,中断由所述SDS控制的电子设备的当前操作。例如在用户为了控制收音机而当前与所述SDS对话,以及所述电话接收到来电呼叫并提供暂停命令给所述SDS的情况中,收音机的操作就被中断以使得在电话呼叫期间能够减少背景噪声电平,由此就提高了用户友好性。 
根据另一个实施例,本发明的方法可以包括在相应的语音对话中断期间,传送控制命令给由所述SDS控制的电子设备。例如如果所述语音对话用于控制光盘(CD)交换机以将一个CD换成另一个CD,以及用户在已经告诉所述SDS想要切换CD之后但在告诉哪一个是新CD之前来决定中断所述对话,所述SDS可以已经提供了控制命令给电子设备以告诉CD播放机将当前CD从播放机移回到盘盒并且等待下一个有关新CD的命令。通过这样做,一旦用户决定继续所述语音对话以及告诉系统他想要听哪个CD,就可以减少用户能听到新CD的等待时间。这再次提高了整个系统的用户友好性。在另一个例子中,可以想到在中断期间,与所述语音对话有关的电子设备能够继续从远方位置下载信息,再次减少了等待时间。 
有利地,取消所述语音对话的步骤可以包括通知用户已经取消了所中断的语音对话。这意味着由所述SDS提供给用户的特定输出通知用户已经取消了早前所中断的语音对话。这样再次提高了所述SDS的用户友好性。
根据有利的实施例,取消所述语音对话的步骤基于用户相应的声学或触觉命令的接收来实现。依据用户的选择,所述取消由此可以由话音或手来实现。 
本发明还可以包括计算机程序产品,该计算机程序产品包括一个或多个计算机可读的媒质,该媒质中具有用于执行前述的方法步骤的计算机可读指令。 
另外,本发明提供一种用于实现与控制至少一个电子设备的用户语音对话的语音对话系统(SDS),包括用于中断所述语音对话的装置,以及用于继续所中断的语音对话的装置。所述SDS由此提供了在任意时间中断语音对话以及在随后的点及时继续的可能性。 
在有利的实施例中,所述用于继续的装置可以配置为在其所中断的位置继续所述语音对话或者通过重复部分语音对话来继续。具有这样的配置,就不必从语音对话的开始重新启动,而可以在其所中断的地方或通过重复部分对话来立即继续所述语音对话。 
在优选实施例中,用于中断所述语音对话的装置和/或用于继续所述语音对话的装置可以包括控制键。可以提供两个附加的控制键,一个用于中断而一个用于继续,或者仅提供一个附加的控制键以配置为一旦第一操作就中断所述语音对话和一旦第二操作就继续所中断语音对话,或者可以是用于切换SDS的开和关的按键通话(PTT)杆,另外可以配置为中断和继续键。依照操作PPT杆的方式或者是所述SDS关闭或所述对话中断或继续,其中不同的操作例如可以是长时间操作所述键以关闭所述SDS和仅短时间操作以中断或继续所述对话。 
在另一个优选实施例中,用于中断所述语音对话的装置可以配置为一旦接收到声学的暂停命令就中断所述语音对话,和/或其中所述用于继续所中断语音对话的装置可以配置为一旦接收到声学的继续命令就继续所中断的语音对话。由此不但可以使用一个键来中断或继续所述语音对话,而且还可以使用相应的语音命令来中断或继续所述语音对话,进一步提高了所述SDS的用户友好性。 
有利地,所述用于中断所述语音对话的装置可以配置为一旦从电子设备接收到暂停命令就中断所述语音对话,和/或其中所述用于继续所述语音对话的装置可以配置为一旦从电子设备接收到继续命令就继续所述语音对话。由此不仅用户能够中断语音对话,而且某种电子设备也可以中断语音对话,这种电子设备是由语音对话控制的不必要的设备、但可以是以某种方式连接到SDS的任意电子设备。作为例子,用户可以实现语音对话以控制所述导航系统并且输入新目标地址,在所述对话期间电话接收到来电呼叫,给所述SDS提供中断命令来中断所述语音对话,以及其通知用户该来电呼叫。一旦所述电话呼叫结束,所述电话然后给所述SDS提供所述继续命令来继续所中断的语音对话。 
在一种变形中,所述SDS可以配置为在第一语音对话中断期间实现第二语音对话,尤其是所述第二语音对话是用于控制不同的电子设备的。在上述导航系统的新目标地址的输入被来电呼叫中断例子中,可以想到在电话谈话期间,用户希望存储新的地址或电话号码到其电话中,并且具有这样的特征,用户就有可能使用所述SDS存储所述新的地址或电话号码,甚至对于已经有第一已中断的语音对话的情况。具有这种可能性,用户由此就不用必须关注是否已经有被中断的语音对话。 
在优选实施例中,所述SDS还可以包括用于存储用户的语音输入的存储装置、以及所述用于继续的装置可以配置为当继续所中断的语音对话时输出至少部分所存储的语音输入。具有这种配置,所述SDS可以重复已经输入的信息或者部分信息,使得用户将知道所中断的语音对话的内容,由此改进了系统的用户友好性。 
在有利的实施例中,所述SDS可以配置为当继续所中断的语音对话时,输出消息来通知用户将要继续所中断的语音对话。具有这种配置,所述SDS使用户回想起随后将要继续的语音对话,由此用户自己将不用必须记住所述语音对话的情形,由此进一步提高了系统的用户友好性。 
在一种变形中,所述SDS可以配置为例如在所述语音对话中断期间,显示所中断的语音对话的标识符,尤其是包括由所中断的语音对话控制的电子设备的名称。有利的是所述SDS包括显示装置,用于显示所中断的语音对话的标识符以及还有正在进行的语音对话的标识符,使得通过简单地看显示器,用户就能注意到当前哪个语音对话被中断,由此提高了所述SDS的用户友好性。 
有利地,所述SDS还可以包括用于取消所中断的语音对话的装置,其中所述用于取消的装置尤其包括控制键,和/或被配置为一旦接收到声学的取消命令就取消所述语音对话。由此在用户不希望继续所述对话的情况中,所述SDS提供了取消所启动的以及之后处于中断的对话的可能性。 
本发明还涉及信息和娱乐系统。因此所提供的信息和娱乐系统包括主要单元和至少一个电子设备,其中所述主要单元包括用于控制至少一个电子设备的装置和按照上述语音对话系统的语音对话系统(SDS),其中至少一个电子设备由所述SDS控制。通过在信息和娱乐系统中提供根据本发明的SDS,上述的所有优点也并入所述信息和娱乐系统中,因而能够大大提高后者的用户友好性。 
所述信息和娱乐系统的至少一个电子设备可以包括至少一个娱乐设备,特别是用于重放模拟或数字音频信号的设备,包括电视设备、和/或收音机设备、和/或小型盒式磁带播放设备、和/或光盘播放设备、和/或超级音频光盘播放设备、和/或数字通用光盘播放设备、和/或MPEG音频层3播放器、和/或个人计算机、和/或播放控制台、和/或电话、和/或至少一个信息设备,特别是导航系统和/或车载计算机。 
在优选实施例中,所述主要单元可以配置为依照预定的第二控制键的操作来中断语音对话,特别是通过语音对话控制的所述电子设备的暂停键。因此不仅所述SDS的控制键或语音命令可以用于中断语音对话,而且由所述语音对话所控制的所述电子设备的键的操作也可以。这种附加的中断语音对话的可能性再次提高了用户友好性,如用户可以直接按压其由语音对话控制的电子设备的暂停键,由此不仅可以中断电子设备的操作,而且可以中断所述语音对话。 
在另一种变形中,所述主要单元或由语音对话控制的至少一个电子设备可以配置为,当所述语音对话中断时就中断所述电子设备的操作。例如如果为了将一个CD换为另一个CD而用所述语音对话控制光盘(CD)交换机,用户在已经告诉SDS他想切换CD之后而在告诉哪一个是新CD之前决定中断所述对话,SDS已经对所述电子设备提供了控制命令以告诉CD播放机将当前CD从播放器移动到带盒中以及等待有关新CD的下一个命令。通过这样做,一旦用户决定继续所述语音对话以及告诉所述系统其想听哪个CD,就可以减少用户能够听到新CD的等待时间。在另一个例子中,可以想到在所述中断期间,有关所述语音对话的电子设备可以继续从远端位置下载信息,就再次减少了等待时间。这再次提高了整个系统的用户友好性。 
根据一种变形,所述主要单元或者由所述语音对话控制的至少一个电子设备可以配置为即使在所述语音对话中断时,所述至少一个电子设备继续工作。在例如用户当前正与所述SDS对话以控制收音机,且电话接收到来电呼叫并给所述SDS提供暂停命令的情况中,所述收音机的操作就被中断,以使得在电话呼叫期间可以减少背景噪声的电平,由此还提高了用户友好性。 
有利地,所述SDS的显示器可以是触摸屏,以及所述SDS可以配置为屏幕部分显示所中断的语音对话被继续的标识。另外,所述SDS可以配置为一旦触摸所述触摸屏的另一个部分就取消所中断的语音对话。所述触摸屏由此实现三个任务,通知用户有关正在进行的对话和通过触摸相应的显示部分来给用户容易地继续其中一个所中断语音对话的可能,以及最后取消一个或多个所中断的语音对话。 
在另一个实施例中,所述语音对话系统还可以包括第三控制键,其配置为给每个所中断的语音对话配备不同的第三控制键,以及依照第二控制键的操作来继续相应的语音对话。与显示所有所中断的和正在进行的语音对话相结合,所述第三控制键给用户提供继续他所希望语音对话的容易的方式。 
本发明还提供具有如先前所述SDS的车辆,尤其是汽车。而且本发明还涉及如先前所述SDS在车辆中的使用,尤其在汽车中。 
本发明还提供具有如先前所述的信息和娱乐系统的车辆,特别是汽车。而且本发明还涉及如先前所述信息和娱乐系统的在车辆中的使用,特别是在汽车中。 
附图说明
以下将参照附图描述本发明方法、所述SDS以及所述信息和娱乐系统的例子,其中: 
图1是车辆的仪表板,示出了包括根据本发明语音对话系统的一个实施例的主要单元所控制的几个电子设备; 
图2是根据本发明SDS的实施例的框图,其是所述主要单元的一部分; 
图3是本发明实现语音对话的方法实施例的功能性框图,其中通过用户的语音输入提供暂停命令; 
图4是根据本发明SDS的实施例的显示所中断语音对话的屏幕和控制键。 
具体实施方式
图1示出了根据本发明包括信息和娱乐系统1的实施例的车辆驾驶座。所述信息和娱乐系统包括几个电子设备:包括光盘(CD)播放器5、或作为变形是数字通用磁盘(DVD)播放器或小型盒式磁带(CC)播放器的收音机设备3,导航系统7,气候控制9,可以是车载电话(未示出)或由移动电话支持架13所持有的移动电话11的电话以及插件式计算机15。所列举的电子设备仅代表一种可能的选择,其它设备,如电视、因特网连接设备或计算机游戏控制台也可以是所述信息和娱乐系统的一部分。 
根据本发明,所述信息和娱乐系统1还包括主要单元17,所述主要单元17包括语音对话系统(SDS)18。所述主要单元17与所有电子设备连接并且发送控制命令和/或从那些电子设备接收命令。本实施例的所述SDS 18包括作为输入装置的话筒19,其安装在观后镜21中当然也可以处于不同的位置或几个不同的位置。应当注意到例如可以在每个乘客位置的附近具有一个话筒19。 
所述SDS18还包括在本实施例中位于驾驶盘25上的控制键23,以及位于多媒体屏幕29附近的控制键27,所述多媒体屏幕29是所述信息和娱乐系统17的一部分并且用作所述SDS 18的输出装置。还提供扩音器31作为输出装置。所述电子设备可以通过控制键33、35、37和39分别控制导航系统7、收音机和CD播放器3、气候控制9以及移动电话或电话11来控制。所述信息和娱乐系统1使用所述SDS18来控制所述电子设备的方式将参照图3所示出的本发明实现用户和SDS之间的语音对话的一个实施例来详细描述。 
图2示出了根据本发明的所述SDS18的实施例的框图,所述SDS18是所述信息和娱乐系统1的一部分。与图1具有相同参考标记的元件代表相同的元件,其在图1的描述中所提及的属性合并在图2的描述中。 
所述SDS18包括几个元件:语音分析单元40、语音对话单元42、用于中断语音对话的装置44、用于继续所中断语音对话的装置46和用于取消所中断语音对话的装置47。 
所述语音分析单元40分析从话筒19接收来的数据。分析包括消除背景噪声和提取出语音输入。 
所述语音对话单元42连接到所述语音分析单元40,连接到所述用于中断语音对话的装置44,连接到用于继续所中断语音对话的装置46,连接到用于取消所中断语音对话的装置47,连接到作为切换所述SDS开和关的按键通话(PTT)杆48,连接到所述输出装置29、31以及到电子设备50。 
所述语音对话单元42从所述语音分析单元40接收所述语音输入,该语音输入然后经过分析和标识为控制命令以传送给电子设备50,最后经过所述主要单元17(图2中未示出)。用于语音输入的信息或请求由所述语音对话单元42经扩音器31或多媒体屏幕29输出给用户。 
所述用于中断语音对话的装置44一旦从所述语音分析单元40、或者从暂停控制键52、或者从电子设备54接收到暂停命令就给用于中断语音对话的语音对话单元42发送暂停信号。 
所述用于继续所中断语音对话的装置46一旦从所述语音分析单元40、或从继续控制键56、或从电子设备54接收到继续命令,就给用于继续所中断语音对话的所述语音对话单元42发送继续信号。 
所述用于取消所中断语音对话的装置47一旦从所述语音分析单元40、或者从取消控制键57接收到取消命令,就给用于取消所中断语音对话的所述语音对话单元42发送取消信号。 
在一种变形中,所述语音对话单元42可以包括用于存储从用户接收的语音输入的存储单元58。 
在所示出的SDS 18的实施例中示出了四个独立的控制键48、52、56和57。但在另一个变形中,一些键可以组合为一个键,以及这样的键可以通过不同方式操作以实现不同的功能。例如暂停命令和继续命令可以由一个组合的控制键提供。根据所述组合的控制键的第一操作中断对话,而根据所述控制键的第二操作继续所述语音对话。在另一个变形中,可以将所有的四个控制键48、52、56和57组合为一个控制键,其中依赖于键的操作方法可以实 现开/关功能、或者暂停/继续或取消功能。而且,除了所示出的控制键48、52、56和57之外,来自图1中示出的电子设备3、5、7、9、11、13、15的控制键也可以实现暂停控制键和继续控制键的角色。例如在CD播放器情况中,所述暂停键还可以作为所述语音的暂停控制和继续控制键的角色。 
在所示出的实施例中,所述SDS18仅控制一个电子设备46。然而与图1结合,可以理解所述SDS18可以用于控制多于一个的电子设备(与所述主要单元17结合)以及多于一个的电子设备可以提供暂停和继续命令。 
在另一变形中,所述语音对话单元42配置为在第一语音对话中断期间,可以开始尤其是控制不同电子设备的第二语音对话。 
图3示出了本发明实现SDS和用户之间语音对话以控制电子设备的方法实施例。图3示出的过程可以由图2示出的SDS18和/或由图1描述的信息和娱乐系统来实现。 
在步骤60检查是否由用户给出对于语音对话的请求。这里用户操作按键通话杆48。如果已经由所述SDS接收到对于语音对话的请求,该过程就继续到步骤62,其中所述SDS18请求来自用户的语音输入。所述语音对话单元42在步骤62之后等待语音输入。步骤64检查是否已经由所述语音对话单元42接收到语音输入,如果是,就在步骤66检查所提供的语音输入是否相应于暂停命令或者包括用于控制电子设备的控制命令。 
在所提供的语音输入包括暂停命令的情况下,就中断对话。所述过程继续步骤68以检查是否已经接收到命令输入。在所述语音对话中断期间,所述多媒体屏幕29可以显示所中断语音对话的标识符,例如可以是所述电子设备的名称。在所述中断期间,还可能的是(图3中未示出)可以开始尤其是用于控制不同电子设备的第二语音对话。 
在一种变形中,在所述语音对话中断期间,相应电子设备的操作也被中断。在这里所述主要单元17或所述SDS18可以对电子设备提供相应的控制命令以中断所述电子设备的操作。在另一个变形中,可以是在所述语音对话期间,所述SDS18给电子设备发送控制命令,以使得所述电子设备已经实现不再需要用户更多指令的操作。例如,在用户希望给导航系统输入新目标地址以获得导航信息、但他仅说完城市而没有说街区之后中断语音对话的情况中,所述导航系统可能在所述语音中断期间计算了到达那个城市的最佳路线, 或者对于将导航系统配置为依据当前位置和最终目的地从远端的定位服务器下载相应地图的情况,所述导航系统可能已经下载了所述相应的地图。 
如果在步骤68已经接收到命令,该过程继续步骤69以检查是否已经接收到继续命令或取消命令。一旦接收到该过程的取消命令,就结束所述对话。最后,所述SDS输出消息来通知用户所述对话已经真正被取消。 
一旦接收到继续命令,所述过程继续步骤70。所述继续命令可以是继续键56(如上所述,其最终与所述PTT杆48结合)的操作或者是语音命令,在所述语音分析单元40经常分析从话筒19接收的信号的情况下来提取用户的继续命令。在步骤70中,所述SDS18对用户提供有关将要被继续的语音对话的信息。尤其是所述SDS18可以声学地和/或光学地输出所中断语音对话的标识符,和/或输出所述中断之前已经实现的部分语音对话。特别地,所述SDS18可以重复用户已经提供的语音输入的内容。在一个变形中,所述信息可以按照用户请求来输出。 
所述过程然后继续步骤62,在其中对于所述SDS18还没有从用户接收到相应的语音输入,就重复输入的最后请求。最后当重复输入的请求时所使用的措词与第一次使用的措词相比可以是不同的,以提醒用户这是继续的语音对话。所述过程然后继续如上所述的步骤64和66,以及在步骤66的所述SDS18接收到控制命令的情况下,所述过程接着继续步骤72,其中能够直接地或者经所述主要单元17来将控制命令发送给所述电子设备。然后由所述电子设备实现所述控制命令。 
在步骤74检查是否已经到达对话结束。如果不是这种情况,所述语音对话就重复步骤62至74直到所述对话结束。 
在上述实现语音对话的本发明方法的实施例中,所述暂停命令是由用户使用语音命令来给出。这种暂停命令当然也可以使用所述暂停键52来给出。使用所述暂停键52具有优点,就是所述过程可以在任何时间中断。而且如上所述,在由所述SDS18从其中一个电子设备接收到暂停命令之后,所述语音对话也可以在任何时间中断,以及一旦从其中一个电子设备接收到继续命令,所述过程也可以继续。 
图4示出了在语音对话的中断期间显示在屏幕29上的信息的例子。在所述屏幕29上显示了两个所中断的对话,一个关于电话呼叫而另一个关于导航 系统。每个所中断的语音对话配备有控制键80、82(作为控制键27的一部分)。依照控制键80的操作来继续所中断的有关所述电话呼叫的语音对话,以及依照控制键82的操作来继续所中断的有关导航系统的语音对话。而且示出了相应于参照图2所描述的控制键48、52、56和57的四个控制键。 
随后,将描述按照本发明的语音对话的例子。 
例1 
      用户(话音进入)     SDS(话音输出)
    100     电话呼叫  
    101       请提供号码
    102     0173  
    103       0173及然后?
    104     暂停  
    105       语音对话冻结
    106     继续  
    107       拨叫电话号码
    108       0173及然后?
    109     3994  
    110       3994
    111       将拨叫号码01733994
例1与进行电话呼叫的语音对话有关。栏1表示用户的语音输入,栏2表示SDS的话音输出。在步骤102已经输入区域码之后,用户在步骤104通过说“暂停”来请求中断所述对话,当然用户也可以执行触摸的暂停命令。随后,所述语音对话被中断并且仅在步骤106用户提供了继续命令之后继续。在步骤107所述SDS然后通知用户哪个语音对话被中断,而且在步骤108重复由用户给出的最后一个输入。所述用户然后继续输入所述电话号码的剩余部分,最后在步骤111所述SDS重复所拨叫的号码以及将相应的控制命令发送给所述电话。 
如可以从步骤103和110所看到的,在这个语音对话中所述SDS重复用户给出的语音输入。 
例2 
      用户(话音进入)     SDS(话音输出)
    200     电话呼叫  
    201       请提供号码
    202     0173  
    203       0173及然后?
    204     暂停  
    205       语音对话冻结
    206     收音机控制  
    207       收音机控制打开
    208     音量降低两个点  
    209       音量降低两个点
    210     继续和重复最后的输入  
    211       拨叫电话号码
    212       0173及然后?
    213     3994  
    214       3994
    215       将拨叫号码01733994
在第二个语音对话例子中,步骤200-205和步骤211-215对应于第一个例子,这里不再详细说明。两个语音对话的区别在于用户在第一个对话中断期间开始第二个语音对话。在步骤206用户请求实现有关收音机的语音对话。在步骤208用户请求改变收音机的音量,这实际上在步骤209实现,由此终止所述第二语音对话。在步骤210所述用户然后请求继续有关电话呼叫的第一所中断的语音对话,并且询问所述SDS来给其提供必要的信息,从而使其知道所述第一语音对话中断的地方。 
例3 
    用户(话音进入)     SDS(话音输出)   其它电子设备(如电话)
    300   收音机控制    
    301       收音机控制打开  
    302   改变收音机频道    
    303       哪个收音机频道  
    304       来电呼叫
    305       语音对话冻结  
    306       电话呼叫终止
    307       哪个收音机频道  
    308   FM98.1    
    309       改变收音机频道到FM98.1  
在例3中,用户为了改变其正在收听的收音机频道而进行语音对话。在步骤304由于来电呼叫而使所述语音对话中断。基于接收到来电呼叫,所述电话给所述SDS发送暂停命令来依次中断所述语音对话。一旦电话呼叫终止,所述电话就给所述SDS发送继续命令,随后所述语音对话继续(307--309)。 
最后,在步骤305可以具有附加的步骤,其中所述SDS通知用户由于所述电话呼叫将使得所述语音对话被中断。 
在所述对话中断期间,所述SDS18还发送控制命令给所述收音机以中断所述收音机的操作,使得所述电话呼叫可以不受收音机的背景噪声的干扰。 
例4 
      用户(话音进入)   SDS(话音输出)  SDS(显示器)
  400     新目标位置    
  401     请拼出位置  
  402     U-L-M    
  403     请从显示器选择一个号码  
  404      1.Ulm 2.Ulmen 3.Ulmenhausen
  405     暂停    
  406      导航对话暂停
  407     继续    
  408     请从显示器选择一个号码  
  409      1.Ulm 2.Ulmen 3.Ulmenhausen
  410     -    
  411     新目标位置Ulm  
例4描述了用户和SDS之间的语音对话,其中所述SDS不仅进行语音输出,而且还包括显示器。所述例子处理对导航系统的新目标位置的输入。在步骤402用户输入目标位置的第一字母,以及随后在步骤403所述SDS宣布所述导航系统找到了几个包括这些字母的位置,并将这些位置显示在连接到SDS的多媒体屏幕上。而且通知用户可以通过宣读相应的号码而选择其中一个位置。在步骤405所述语音对话由于用户相应的语音暂停命令而被中断。在所述中断期间,所述多媒体屏幕29显示所述导航语音对话已经被中断。随着用户的继续命令,所述SDS重复对于语音对话的最后请求,并且所述屏幕显示有关所述位置的相同选择。用户然后选择其中一个位置,所述新目标位置就可以被输入到所述导航系统。 
在一种变形中,所述导航系统可以在所述语音对话中断期间已经生成有关三个可能位置的导航信息。一旦所述语音对话被继续,用户就进行选择, 所述导航系统就立即建议相应的导航信息以加速所述应用。 
在一种变形中,在上述所有的例子中,所中断的语音对话还可以由用户通过提供声学或者触觉的取消命令来取消。 
已经在车辆环境中解释了有关本发明信息和娱乐系统、本发明SDS18和本发明方法的上述实施例。实现SDS和用户之间语音对话的本发明SDS和本发明方法,还可以应用到用户与便携式数字助理(PDA)之间的对话或者其它经由电话的基于计算机的对话中。按照本发明的语音对话一般可以应用于控制任何电子设备的操作。 

Claims (22)

1.一种用于实现语音对话系统(18)和用户之间的语音对话,以控制至少一个电子设备(3、5、7、9、11、15)的方法,包括以下步骤:
通过所述语音对话系统(18),根据预定的暂停命令(66)的接收,中断所述语音对话;以及
通过所述语音对话系统(18),根据预定的继续命令(68)的接收,继续所述语音对话,其中,所述继续所述语音对话的步骤包括,由所述语音对话系统输出在中断所述语音对话之前的至少一个所述语音对话系统的最后输出,和/或在中断所述语音对话之前的至少一个从用户接收的最后输入;以及
由所述语音对话系统随后等待用户的语音输入。
2.按照权利要求1的方法,其中所述继续所述语音对话的步骤包括通知用户继续所中断的语音对话。
3.按照权利要求1的方法,其中所述中断和/或继续所述语音对话的步骤是根据用户相应的声学或触觉命令的接收、或者根据所述语音对话系统(18)对电子设备(3、5、7、9、11、15)的相应命令的接收来执行的。
4.按照权利要求1的方法,还包括开始另一个语音对话,用于控制不同的电子设备(3、5、7、9、11、15)。
5.按照权利要求4的方法,其中继续所中断的语音对话包括,通过输出由所述语音对话控制的所述电子设备(3、5、7、9、11、15)的标识符来通知用户所继续的语音对话。
6.按照权利要求1的方法,包括显示所中断语音对话的标识符。
7.按照权利要求1的方法,包括在所述相应的语音对话中断期间,中断由所述语音对话系统(18)控制的所述电子设备(3、5、7、9、11、15)的当前操作。
8.按照权利要求1的方法,包括在所述相应的语音对话中断期间,给由所述语音对话系统(18)控制的所述电子设备(3、5、7、9、11、15)发送控制命令。
9.按照权利要求1的方法,其中还包括通过所述语音对话系统,根据预定的取消命令(69)的接收,取消所述语音对话的步骤,所述取消所述语音对话的步骤包括通知用户所中断的语音对话被取消。
10.按照权利要求9的方法,其中所述取消所述语音对话的步骤是根据用户相应的声学或触觉命令的接收来执行的。
11.一种用于实现与用户的语音对话以控制至少一个电子设备(3、5、7、9、11、15)的语音对话系统(18),包括:
用于中断所述语音对话的装置(44),以及
用于继续所述中断语音对话的装置(46),
所述语音对话系统用于实现如权利要求1所述的方法。
12.按照权利要求11的语音对话系统,其中所述用于中断所述语音对话的装置(44)和/或用于继续所述语音对话的装置(46)包括控制键(48、56、23、27)。
13.按照权利要求11的语音对话系统,其中所述用于中断所述语音对话的装置(44)配置为根据声学暂停命令的接收,中断所述语音对话,和/或其中所述用于继续所中断语音对话的装置(46)配置为根据声学继续命令的接收,继续所中断的语音对话。
14.按照权利要求11的语音对话系统,其中所述用于中断所述语音对话的装置(44)配置为根据来自电子设备(3、5、7、9、11、15)的暂停命令的接收来中断所述语音对话,和/或其中所述用于继续所述语音对话的装置(46)配置为根据来自电子设备(3、5、7、9、11、15)的继续命令的接收来继续所述语音对话。
15.按照权利要求11的语音对话系统,配置为在第一语音对话中断期间实现第二语音对话,所述第二语音对话用于控制不同的电子设备(3、5、7、9、11、15)。
16.按照权利要求11的语音对话系统,还包括用于存储用户的语音输入的存储装置(58),以及其中所述语音对话系统配置为当继续所中断的语音对话时,就输出所存储的语音输入的至少一部分。
17.按照权利要求11的语音对话系统,配置为当继续所中断的语音对话时,就输出消息来通知用户所中断的语音对话将被继续。
18.按照权利要求15的语音对话系统,配置为在所述语音对话中断期间,显示所中断的语音对话的标识符。
19.按照权利要求11的语音对话系统,还包括用于取消所中断的语音对话的装置(47),其中用于取消的装置(47)包括控制键(57)和/或该装置配置为根据声学取消命令的接收来取消所述语音对话。
20.一种信息和娱乐系统,包括主要单元(17)和至少一个电子设备(3、5、7、9、11、15),其中所述主要单元包括用于控制至少一个电子设备(3、5、7、9、11、15)的装置和按照权利要求11的语音对话系统(18),其中所述至少一个电子设备(3、5、7、9、11、15)的至少其中之一由所述语音对话系统(18)控制。
21.按照权利要求20的信息和娱乐系统,其中所述主要单元(18)或者由所述语音对话控制的所述至少一个电子设备(3、5、7、9、11、15)配置为当所述语音对话中断时,就中断所述电子设备(3、5、7、9、11、15)的操作。
22.按照权利要求21的信息和娱乐系统,其中所述主要单元(18)或者由所述语音对话控制的所述至少一个电子设备(3、5、7、9、11、15)配置为即使所述语音对话被中断,也要继续所述电子设备(3、5、7、9、11、15)的操作。
CN2005100542203A 2004-01-29 2005-01-31 实现语音对话的方法及其语音对话系统 Active CN1655233B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04001949.9 2004-01-29
EP04001949A EP1560200B8 (en) 2004-01-29 2004-01-29 Method and system for spoken dialogue interface

Publications (2)

Publication Number Publication Date
CN1655233A CN1655233A (zh) 2005-08-17
CN1655233B true CN1655233B (zh) 2012-04-11

Family

ID=34639412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005100542203A Active CN1655233B (zh) 2004-01-29 2005-01-31 实现语音对话的方法及其语音对话系统

Country Status (8)

Country Link
US (1) US7454351B2 (zh)
EP (1) EP1560200B8 (zh)
JP (1) JP2005215694A (zh)
KR (1) KR20050077806A (zh)
CN (1) CN1655233B (zh)
AT (1) ATE415684T1 (zh)
CA (1) CA2494795C (zh)
DE (1) DE602004017955D1 (zh)

Families Citing this family (262)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001013255A2 (en) 1999-08-13 2001-02-22 Pixo, Inc. Displaying and traversing links in character array
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
ITFI20010199A1 (it) 2001-10-22 2003-04-22 Riccardo Vieri Sistema e metodo per trasformare in voce comunicazioni testuali ed inviarle con una connessione internet a qualsiasi apparato telefonico
US20040073690A1 (en) 2002-09-30 2004-04-15 Neil Hepworth Voice over IP endpoint call admission
US7359979B2 (en) 2002-09-30 2008-04-15 Avaya Technology Corp. Packet prioritization and associated bandwidth and buffer management techniques for audio over IP
US7669134B1 (en) 2003-05-02 2010-02-23 Apple Inc. Method and apparatus for displaying information during an instant messaging session
US7978827B1 (en) 2004-06-30 2011-07-12 Avaya Inc. Automatic configuration of call handling based on end-user needs and characteristics
US20060271520A1 (en) * 2005-05-27 2006-11-30 Ragan Gene Z Content-based implicit search query
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7633076B2 (en) 2005-09-30 2009-12-15 Apple Inc. Automated response to and sensing of user activity in portable devices
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8214219B2 (en) 2006-09-15 2012-07-03 Volkswagen Of America, Inc. Speech communications system for a vehicle and method of operating a speech communications system for a vehicle
US7984440B2 (en) * 2006-11-17 2011-07-19 Sap Ag Interactive audio task system with interrupt recovery and confirmations
EP2092275B1 (en) 2006-12-20 2012-10-31 Johnson Controls Technology Company System and method for providing route calculation and information to a vehicle
JP5676108B2 (ja) 2006-12-20 2015-02-25 ジョンソン コントロールズ テクノロジー カンパニーJohnson Controls Technology Company リモートディスプレイ再現システム
US9587958B2 (en) 2007-01-23 2017-03-07 Visteon Global Technologies, Inc. Mobile device gateway systems and methods
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
ITFI20070177A1 (it) 2007-07-26 2009-01-27 Riccardo Vieri Sistema per la creazione e impostazione di una campagna pubblicitaria derivante dall'inserimento di messaggi pubblicitari all'interno di uno scambio di messaggi e metodo per il suo funzionamento.
DE102007036425B4 (de) 2007-08-02 2023-05-17 Volkswagen Ag Menügesteuertes Mehrfunktionssystem insbesondere für Fahrzeuge
US9053089B2 (en) 2007-10-02 2015-06-09 Apple Inc. Part-of-speech tagging using latent analogy
US8165886B1 (en) 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
US8595642B1 (en) 2007-10-04 2013-11-26 Great Northern Research, LLC Multiple shell multi faceted graphical user interface
US8364694B2 (en) 2007-10-26 2013-01-29 Apple Inc. Search assistant for digital media assets
US8620662B2 (en) 2007-11-20 2013-12-31 Apple Inc. Context-aware unit selection
JP5623287B2 (ja) * 2007-12-05 2014-11-12 ジョンソン コントロールズテクノロジーカンパニーJohnson Controls Technology Company 車両ユーザインターフェースシステム及び方法
US9324230B2 (en) 2008-12-04 2016-04-26 Gentex Corporation System and method for configuring a wireless control system of a vehicle using induction field communication
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8327272B2 (en) 2008-01-06 2012-12-04 Apple Inc. Portable multifunction device, method, and graphical user interface for viewing and managing electronic calendars
US8065143B2 (en) 2008-02-22 2011-11-22 Apple Inc. Providing text input using speech data and non-speech data
US8289283B2 (en) 2008-03-04 2012-10-16 Apple Inc. Language input interface on a device
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8464150B2 (en) 2008-06-07 2013-06-11 Apple Inc. Automatic language identification for dynamic text processing
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8768702B2 (en) 2008-09-05 2014-07-01 Apple Inc. Multi-tiered voice feedback in an electronic device
US8898568B2 (en) 2008-09-09 2014-11-25 Apple Inc. Audio user interface
US8352268B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for selective rate of speech and speech preferences for text to speech synthesis
US8355919B2 (en) 2008-09-29 2013-01-15 Apple Inc. Systems and methods for text normalization for text to speech synthesis
US8352272B2 (en) 2008-09-29 2013-01-08 Apple Inc. Systems and methods for text to speech synthesis
US8583418B2 (en) 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8218751B2 (en) 2008-09-29 2012-07-10 Avaya Inc. Method and apparatus for identifying and eliminating the source of background noise in multi-party teleconferences
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8396714B2 (en) 2008-09-29 2013-03-12 Apple Inc. Systems and methods for concatenation of words in text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8862252B2 (en) 2009-01-30 2014-10-14 Apple Inc. Audio user interface for displayless electronic device
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US10540976B2 (en) 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10387140B2 (en) 2009-07-23 2019-08-20 S3G Technology Llc Modification of terminal and service provider machines using an update server machine
DE102009051882A1 (de) * 2009-11-04 2011-05-05 Volkswagen Ag Verfahren und Vorrichtung zur Spracheingabe für ein Fahrzeug
US8682649B2 (en) 2009-11-12 2014-03-25 Apple Inc. Sentiment prediction from textual data
US8600743B2 (en) 2010-01-06 2013-12-03 Apple Inc. Noise profile determination for voice-related feature
US8311838B2 (en) 2010-01-13 2012-11-13 Apple Inc. Devices and methods for identifying a prompt corresponding to a voice input in a sequence of prompts
US8381107B2 (en) 2010-01-13 2013-02-19 Apple Inc. Adaptive audio feedback system and method
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10115392B2 (en) * 2010-06-03 2018-10-30 Visteon Global Technologies, Inc. Method for adjusting a voice recognition system comprising a speaker and a microphone, and voice recognition system
US8639516B2 (en) 2010-06-04 2014-01-28 Apple Inc. User-specific noise suppression for voice quality improvements
US20110307250A1 (en) * 2010-06-10 2011-12-15 Gm Global Technology Operations, Inc. Modular Speech Recognition Architecture
US8713021B2 (en) 2010-07-07 2014-04-29 Apple Inc. Unsupervised document clustering using latent semantic density analysis
US9104670B2 (en) 2010-07-21 2015-08-11 Apple Inc. Customized search or acquisition of digital media assets
US8719006B2 (en) 2010-08-27 2014-05-06 Apple Inc. Combined statistical and rule-based part-of-speech tagging for text-to-speech synthesis
US8719014B2 (en) 2010-09-27 2014-05-06 Apple Inc. Electronic device with text error correction based on voice recognition data
KR101715381B1 (ko) * 2010-11-25 2017-03-10 삼성전자 주식회사 전자장치 및 그 제어방법
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US10515147B2 (en) 2010-12-22 2019-12-24 Apple Inc. Using statistical language models for contextual lookup
US8781836B2 (en) 2011-02-22 2014-07-15 Apple Inc. Hearing assistance system for providing consistent human speech
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US20120310642A1 (en) 2011-06-03 2012-12-06 Apple Inc. Automatically creating a mapping between text data and audio data
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8812294B2 (en) 2011-06-21 2014-08-19 Apple Inc. Translating phrases from one language into another using an order-based set of declarative rules
US8706472B2 (en) 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8762156B2 (en) 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US9077813B2 (en) 2012-02-29 2015-07-07 International Business Machines Corporation Masking mobile message content
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US8775442B2 (en) 2012-05-15 2014-07-08 Apple Inc. Semantic search using a single-source semantic model
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
WO2013185109A2 (en) 2012-06-08 2013-12-12 Apple Inc. Systems and methods for recognizing textual identifiers within a plurality of words
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
CN102855873A (zh) * 2012-08-03 2013-01-02 海信集团有限公司 一种控制电子设备的方法及电子设备
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US8935167B2 (en) 2012-09-25 2015-01-13 Apple Inc. Exemplar-based latent perceptual modeling for automatic speech recognition
USRE47974E1 (en) * 2012-11-28 2020-05-05 Google Llc Dialog system with automatic reactivation of speech acquiring mode
US9570090B2 (en) * 2015-05-26 2017-02-14 Google Inc. Dialog system with automatic reactivation of speech acquiring mode
RU2530267C2 (ru) * 2012-11-28 2014-10-10 Общество с ограниченной ответственностью "Спиктуит" Способ коммуникации пользователя с информационной диалоговой системой
US9530409B2 (en) 2013-01-23 2016-12-27 Blackberry Limited Event-triggered hands-free multitasking for media playback
KR102516577B1 (ko) 2013-02-07 2023-04-03 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US10572476B2 (en) 2013-03-14 2020-02-25 Apple Inc. Refining a search based on schedule items
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10642574B2 (en) 2013-03-14 2020-05-05 Apple Inc. Device, method, and graphical user interface for outputting captions
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
US9977779B2 (en) 2013-03-14 2018-05-22 Apple Inc. Automatic supplementation of word correction dictionaries
US9733821B2 (en) 2013-03-14 2017-08-15 Apple Inc. Voice control to diagnose inadvertent activation of accessibility features
CN112230878A (zh) 2013-03-15 2021-01-15 苹果公司 对中断进行上下文相关处理
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11151899B2 (en) 2013-03-15 2021-10-19 Apple Inc. User training by intelligent digital assistant
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
DE102013006173A1 (de) * 2013-04-10 2014-10-16 Audi Ag Verfahren und Vorrichtung zur proaktiven Dialogführung
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3008641A1 (en) 2013-06-09 2016-04-20 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
US9640182B2 (en) * 2013-07-01 2017-05-02 Toyota Motor Engineering & Manufacturing North America, Inc. Systems and vehicles that provide speech recognition system notifications
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
JP6411017B2 (ja) * 2013-09-27 2018-10-24 クラリオン株式会社 サーバ、及び、情報処理方法
US20150115849A1 (en) * 2013-10-24 2015-04-30 Regal Beloit America, Inc. System and method for pausing and resuming an operation of a motor
US9698999B2 (en) * 2013-12-02 2017-07-04 Amazon Technologies, Inc. Natural language control of secondary device
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
DE102014002543A1 (de) * 2014-02-22 2015-08-27 Audi Ag Verfahren zur Erfassung wenigstens zweier zu erfassender Informationen mit zu verknüpfendem Informationsgehalt durch eine Sprachdialogeinrichtung, Sprachdialogeinrichtung und Kraftfahrzeug
KR101770187B1 (ko) 2014-03-27 2017-09-06 한국전자통신연구원 음성 대화를 통한 네비게이션 제어 장치 및 방법
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
CN105138110A (zh) * 2014-05-29 2015-12-09 中兴通讯股份有限公司 语音交互方法及装置
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9248841B1 (en) * 2014-11-24 2016-02-02 Ford Global Technologies, Llc Methods and apparatus for state dependent micro-interaction fulfillment
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
CN104536673B (zh) * 2014-12-11 2017-09-15 广东好帮手电子科技股份有限公司 读取车机微信接受音频信息的方法及系统
US9792901B1 (en) * 2014-12-11 2017-10-17 Amazon Technologies, Inc. Multiple-source speech dialog input
US9911415B2 (en) * 2014-12-19 2018-03-06 Lenovo (Singapore) Pte. Ltd. Executing a voice command during voice input
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) * 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
WO2017100167A1 (en) * 2015-12-06 2017-06-15 Voicebox Technologies Corporation System and method of conversational adjustment based on user's cognitive state and/or situational state
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9922655B2 (en) * 2016-05-31 2018-03-20 International Business Machines Corporation System, method, and recording medium for controlling dialogue interruptions by a speech output device
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
KR102515996B1 (ko) * 2016-08-26 2023-03-31 삼성전자주식회사 음성 인식을 위한 전자 장치 및 그 제어 방법
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
GB2558669B (en) * 2017-01-17 2020-04-22 Jaguar Land Rover Ltd Communication control apparatus and method
KR102338990B1 (ko) * 2017-01-23 2021-12-14 현대자동차주식회사 대화 시스템, 이를 포함하는 차량 및 대화 처리 방법
US10178603B2 (en) 2017-02-20 2019-01-08 International Business Machines Corporation Pausing functions of an assistant device during an active telephone call
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
US10269351B2 (en) 2017-05-16 2019-04-23 Google Llc Systems, methods, and apparatuses for resuming dialog sessions via automated assistant
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10535360B1 (en) * 2017-05-25 2020-01-14 Tp Lab, Inc. Phone stand using a plurality of directional speakers
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US11178280B2 (en) 2017-06-20 2021-11-16 Lenovo (Singapore) Pte. Ltd. Input during conversational session
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
JPWO2019087811A1 (ja) * 2017-11-02 2020-09-24 ソニー株式会社 情報処理装置、及び情報処理方法
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
KR102640308B1 (ko) 2018-03-05 2024-02-23 구글 엘엘씨 자동화 어시스턴트를 이용한 이전 대화 컨텍스트사이의전환
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
KR102192144B1 (ko) * 2018-11-30 2020-12-17 엘지전자 주식회사 차량 제어장치 및 차량 제어방법
JP2020160725A (ja) * 2019-03-26 2020-10-01 株式会社東海理化電機製作所 音声対話装置、入力装置及び出力装置
JP2020157854A (ja) * 2019-03-26 2020-10-01 本田技研工業株式会社 エージェント装置、エージェント装置の制御方法、およびプログラム
CN110001558A (zh) * 2019-04-18 2019-07-12 百度在线网络技术(北京)有限公司 用于控制车辆的方法和装置
KR20210114480A (ko) * 2019-05-06 2021-09-23 구글 엘엘씨 자동 통화 시스템
KR20190089128A (ko) * 2019-07-10 2019-07-30 엘지전자 주식회사 음성 인식 방법 및 음성 인식 장치
KR20190118996A (ko) * 2019-10-01 2019-10-21 엘지전자 주식회사 음성 처리 방법 및 음성 처리 장치
KR20210050901A (ko) * 2019-10-29 2021-05-10 엘지전자 주식회사 음성 인식 방법 및 음성 인식 장치
JP7407046B2 (ja) * 2020-03-26 2023-12-28 本田技研工業株式会社 音声出力の制御方法および音声出力制御装置
CN114255757A (zh) * 2020-09-22 2022-03-29 阿尔卑斯阿尔派株式会社 语音信息处理装置及语音信息处理方法
DE102020129601A1 (de) 2020-11-10 2022-05-12 nxtbase technologies GmbH Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102020129605A1 (de) 2020-11-10 2022-05-12 nxtbase technologies GmbH Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
US11955137B2 (en) 2021-03-11 2024-04-09 Apple Inc. Continuous dialog with a digital assistant
CN114863929B (zh) * 2022-07-11 2022-10-21 深圳市人马互动科技有限公司 语音交互方法、装置、系统、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2976939B2 (ja) * 1997-07-14 1999-11-10 日本電気株式会社 移動体通信システム
US6208932B1 (en) * 1996-09-30 2001-03-27 Mazda Motor Corporation Navigation apparatus
US20020067839A1 (en) * 2000-12-04 2002-06-06 Heinrich Timothy K. The wireless voice activated and recogintion car system
GB2372864A (en) * 2001-02-28 2002-09-04 Vox Generation Ltd Spoken language interface
CN1394438A (zh) * 2000-10-23 2003-01-29 松下电器产业株式会社 信息发布再生系统、信息发布方法、信息再生方法、信息记录方法、信息发布装置、信息再生装置、信息记录装置、记录介质以及作业装置
US6626263B2 (en) * 1998-11-30 2003-09-30 Joseph Yaacoub Sahyoun Passive speaker system
US6658646B1 (en) * 1999-09-29 2003-12-02 Lucent Technologies Inc. Multiple interface scripting language

Family Cites Families (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4625081A (en) * 1982-11-30 1986-11-25 Lotito Lawrence A Automated telephone voice service system
US4827520A (en) 1987-01-16 1989-05-02 Prince Corporation Voice actuated control system for use in a vehicle
JPH06259090A (ja) * 1993-03-09 1994-09-16 Nec Corp 音声対話システム
DE19533541C1 (de) * 1995-09-11 1997-03-27 Daimler Benz Aerospace Ag Verfahren zur automatischen Steuerung eines oder mehrerer Geräte durch Sprachkommandos oder per Sprachdialog im Echtzeitbetrieb und Vorrichtung zum Ausführen des Verfahrens
US5799279A (en) 1995-11-13 1998-08-25 Dragon Systems, Inc. Continuous speech recognition of text and commands
US6073101A (en) 1996-02-02 2000-06-06 International Business Machines Corporation Text independent speaker recognition for transparent command ambiguity resolution and continuous access control
DE19608869C2 (de) 1996-03-07 1998-03-26 Daimler Benz Ag Bediensystem, insbesondere für Komponenten in einem Kraftfahrzeug
US6658466B1 (en) * 1996-10-16 2003-12-02 Ncr Corporation Method and apparatus for integrating remote human interactive assistance function into software systems
US6073013A (en) 1996-11-04 2000-06-06 Qualcomm Incorporated Method and apparatus for performing position-based call processing in a mobile telephone system
US6169789B1 (en) 1996-12-16 2001-01-02 Sanjay K. Rao Intelligent keyboard system
US6041300A (en) 1997-03-21 2000-03-21 International Business Machines Corporation System and method of using pre-enrolled speech sub-units for efficient speech synthesis
CA2292959A1 (en) 1997-05-06 1998-11-12 Speechworks International, Inc. System and method for developing interactive speech applications
GB2325110B (en) 1997-05-06 2002-10-16 Ibm Voice processing system
FI972723A0 (fi) 1997-06-24 1997-06-24 Nokia Mobile Phones Ltd Mobila kommunikationsanordningar
US6138098A (en) 1997-06-30 2000-10-24 Lernout & Hauspie Speech Products N.V. Command parsing and rewrite system
DE69712485T2 (de) 1997-10-23 2002-12-12 Sony Int Europe Gmbh Sprachschnittstelle für ein Hausnetzwerk
JP3505982B2 (ja) * 1997-10-24 2004-03-15 日産自動車株式会社 音声対話装置
US6012030A (en) 1998-04-21 2000-01-04 Nortel Networks Corporation Management of speech and audio prompts in multimodal interfaces
KR100754497B1 (ko) 1998-05-07 2007-09-03 뉘앙스 커뮤니케이션스 이스라엘, 리미티드 수기 및 음성으로 자동차 부속 장치를 제어하는 장치 및방법
US6236968B1 (en) 1998-05-14 2001-05-22 International Business Machines Corporation Sleep prevention dialog based car system
JP3157788B2 (ja) 1998-11-12 2001-04-16 埼玉日本電気株式会社 携帯型情報端末
US6246981B1 (en) 1998-11-25 2001-06-12 International Business Machines Corporation Natural language task-oriented dialog manager and method
US6931446B1 (en) 1998-12-14 2005-08-16 International Business Machines Corporation Methods, systems and computer program products for policy based network control of characteristics of user sessions
GB2347823A (en) 1999-03-01 2000-09-13 Motorola Ltd Paying for cellular communications service when roaming
US6396481B1 (en) 1999-04-19 2002-05-28 Ecrio Inc. Apparatus and method for portable handwriting capture
US6505155B1 (en) 1999-05-06 2003-01-07 International Business Machines Corporation Method and system for automatically adjusting prompt feedback based on predicted recognition accuracy
EP1063636A3 (en) 1999-05-21 2001-11-14 Winbond Electronics Corporation Method and apparatus for standard voice user interface and voice controlled devices
US6584439B1 (en) 1999-05-21 2003-06-24 Winbond Electronics Corporation Method and apparatus for controlling voice controlled devices
US6345254B1 (en) 1999-05-29 2002-02-05 International Business Machines Corp. Method and apparatus for improving speech command recognition accuracy using event-based constraints
AUPQ141999A0 (en) 1999-07-05 1999-07-29 Worldlingo.Com Pty Ltd Communication processing system
US6499015B2 (en) 1999-08-12 2002-12-24 International Business Machines Corporation Voice interaction method for a computer graphical user interface
US6598020B1 (en) 1999-09-10 2003-07-22 International Business Machines Corporation Adaptive emotion and initiative generator for conversational systems
US6658388B1 (en) 1999-09-10 2003-12-02 International Business Machines Corporation Personality generator for conversational systems
US6442522B1 (en) 1999-10-12 2002-08-27 International Business Machines Corporation Bi-directional natural language system for interfacing with multiple back-end applications
US6594630B1 (en) 1999-11-19 2003-07-15 Voice Signal Technologies, Inc. Voice-activated control for electrical device
EP1104978A1 (de) 1999-11-30 2001-06-06 TELEFONAKTIEBOLAGET LM ERICSSON (publ) Verfahren und Vorrichtung zur Anwahl von Diensten
GB9929284D0 (en) 1999-12-11 2000-02-02 Ibm Voice processing apparatus
US6748361B1 (en) 1999-12-14 2004-06-08 International Business Machines Corporation Personal speech assistant supporting a dialog manager
GB9930731D0 (en) 1999-12-22 2000-02-16 Ibm Voice processing apparatus
SE519537C2 (sv) 2000-01-21 2003-03-11 Richard Granberg Elektronisk anordning med tryckkänslig bildskärm och förskjutbart tangentborg
US6654720B1 (en) 2000-05-09 2003-11-25 International Business Machines Corporation Method and system for voice control enabling device in a service discovery network
FR2808915B1 (fr) 2000-05-15 2005-06-10 Nacam Dispositif de commande a distances d'organes ou d'equipements de vehicule automobile
US6422522B1 (en) 2000-06-05 2002-07-23 Jeffrey K. Woollen Stand for supporting a musical instrument
US6741963B1 (en) 2000-06-21 2004-05-25 International Business Machines Corporation Method of managing a speech cache
WO2002005264A1 (de) 2000-07-07 2002-01-17 Siemens Aktiengesellschaft Sprachgesteuerte anordnung und verfahren zur spracheingabe und -erkennung
US6925495B2 (en) 2000-07-13 2005-08-02 Vendaria Media, Inc. Method and system for delivering and monitoring an on-demand playlist over a network using a template
DE10041456A1 (de) 2000-08-23 2002-03-07 Philips Corp Intellectual Pty Verfahren zum Steuern von Geräten mittels Sprachsignalen, insbesondere bei Kraftfahrzeugen
US6785651B1 (en) 2000-09-14 2004-08-31 Microsoft Corporation Method and apparatus for performing plan-based dialog
CN1173498C (zh) 2000-10-13 2004-10-27 国际商业机器公司 语音允许的蓝牙设备管理和访问装置及有关控制方法
DE60133529T2 (de) 2000-11-23 2009-06-10 International Business Machines Corp. Sprachnavigation in Webanwendungen
US7085723B2 (en) 2001-01-12 2006-08-01 International Business Machines Corporation System and method for determining utterance context in a multi-context speech application
US7127402B2 (en) 2001-01-12 2006-10-24 International Business Machines Corporation Method and apparatus for converting utterance representations into actions in a conversational system
US7257537B2 (en) 2001-01-12 2007-08-14 International Business Machines Corporation Method and apparatus for performing dialog management in a computer conversational interface
US6950793B2 (en) 2001-01-12 2005-09-27 International Business Machines Corporation System and method for deriving natural language representation of formal belief structures
EP1231798B1 (en) 2001-02-07 2007-01-24 NTT DoCoMo, Inc. Language selecting method and mobile communication system
JP3919210B2 (ja) * 2001-02-15 2007-05-23 アルパイン株式会社 音声入力案内方法及び装置
US7171365B2 (en) 2001-02-16 2007-01-30 International Business Machines Corporation Tracking time using portable recorders and speech recognition
US6907119B2 (en) 2001-03-08 2005-06-14 Qwest Communications International, Inc. Automated business directory assistance
US6801897B2 (en) 2001-03-28 2004-10-05 International Business Machines Corporation Method of providing concise forms of natural commands
US6832196B2 (en) 2001-03-30 2004-12-14 International Business Machines Corporation Speech driven data selection in a voice-enabled program
CA2344904A1 (en) 2001-04-23 2002-10-23 Bruno Richard Preiss Interactive voice response system and method
US20030005159A1 (en) 2001-06-07 2003-01-02 International Business Machines Corporation Method and system for generating and serving multilingual web pages
US20020198699A1 (en) 2001-06-21 2002-12-26 International Business Machines Corporation Apparatus, system and method for providing open source language translation
US7289962B2 (en) 2001-06-28 2007-10-30 International Business Machines Corporation Compressed list presentation for speech user interfaces
US20030040899A1 (en) 2001-08-13 2003-02-27 Ogilvie John W.L. Tools and techniques for reader-guided incremental immersion in a foreign language text
US6984176B2 (en) 2001-09-05 2006-01-10 Pointstreak.Com Inc. System, methodology, and computer program for gathering hockey and hockey-type game data
US6721633B2 (en) 2001-09-28 2004-04-13 Robert Bosch Gmbh Method and device for interfacing a driver information system using a voice portal server
JP3963698B2 (ja) * 2001-10-23 2007-08-22 富士通テン株式会社 音声対話システム
US7099829B2 (en) 2001-11-06 2006-08-29 International Business Machines Corporation Method of dynamically displaying speech recognition system information
US6922200B1 (en) 2001-11-30 2005-07-26 Oracle International Corporation Delivering a graphical object to a browser
US6704396B2 (en) 2002-02-27 2004-03-09 Sbc Technology Resources, Inc. Multi-modal communications method
US20030191646A1 (en) 2002-04-08 2003-10-09 D'avello Robert F. Method of setting voice processing parameters in a communication device
US20040198326A1 (en) 2002-04-09 2004-10-07 Vijay Hirani Personalized language announcements
US7174298B2 (en) 2002-06-24 2007-02-06 Intel Corporation Method and apparatus to improve accuracy of mobile speech-enabled services
US20040078762A1 (en) 2002-10-17 2004-04-22 Taiwan Semiconductor Manufacturing Co., Ltd. Multi-lingual information server apparatus and method for operation thereof
US7197331B2 (en) 2002-12-30 2007-03-27 Motorola, Inc. Method and apparatus for selective distributed speech recognition
US7536293B2 (en) 2003-02-24 2009-05-19 Microsoft Corporation Methods and systems for language translation
US7451129B2 (en) 2003-03-31 2008-11-11 Google Inc. System and method for providing preferred language ordering of search results
US8301436B2 (en) 2003-05-29 2012-10-30 Microsoft Corporation Semantic object synchronous understanding for highly interactive interface
US20040264677A1 (en) 2003-06-30 2004-12-30 Horvitz Eric J. Ideal transfer of call handling from automated systems to human operators based on forecasts of automation efficacy and operator load
EP1524778A1 (en) 2003-10-15 2005-04-20 Harman Becker Automotive Systems GmbH Method for communicating information from a server to a user via a mobile communication device running a dialog script

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6208932B1 (en) * 1996-09-30 2001-03-27 Mazda Motor Corporation Navigation apparatus
JP2976939B2 (ja) * 1997-07-14 1999-11-10 日本電気株式会社 移動体通信システム
US6626263B2 (en) * 1998-11-30 2003-09-30 Joseph Yaacoub Sahyoun Passive speaker system
US6658646B1 (en) * 1999-09-29 2003-12-02 Lucent Technologies Inc. Multiple interface scripting language
CN1394438A (zh) * 2000-10-23 2003-01-29 松下电器产业株式会社 信息发布再生系统、信息发布方法、信息再生方法、信息记录方法、信息发布装置、信息再生装置、信息记录装置、记录介质以及作业装置
US20020067839A1 (en) * 2000-12-04 2002-06-06 Heinrich Timothy K. The wireless voice activated and recogintion car system
GB2372864A (en) * 2001-02-28 2002-09-04 Vox Generation Ltd Spoken language interface

Also Published As

Publication number Publication date
ATE415684T1 (de) 2008-12-15
CN1655233A (zh) 2005-08-17
JP2005215694A (ja) 2005-08-11
DE602004017955D1 (de) 2009-01-08
CA2494795A1 (en) 2005-07-29
EP1560200A1 (en) 2005-08-03
KR20050077806A (ko) 2005-08-03
CA2494795C (en) 2014-07-08
US20050267759A1 (en) 2005-12-01
US7454351B2 (en) 2008-11-18
EP1560200B8 (en) 2009-08-05
EP1560200B1 (en) 2008-11-26

Similar Documents

Publication Publication Date Title
CN1655233B (zh) 实现语音对话的方法及其语音对话系统
US7308289B2 (en) Method and system for managing in-vehicle telephony
CN101222238B (zh) 用于信息处理设备的音频输出方法
US20110213553A1 (en) Navigation device
EP1300829A1 (en) Technique for active voice recognition grammar adaptation for dynamic multimedia application
EP1560199A1 (en) Multi-modal data input
US9841293B2 (en) In-vehicle display system for navigation and additional functions
US20070054702A1 (en) Mobile device enhancement via a vehicular telematics system
US8825115B2 (en) Handoff from public to private mode for communications
US20050124322A1 (en) System for communication information from a server via a mobile communication device
JP2008021337A (ja) 車載用音響システム
JP4183588B2 (ja) 車載用音響装置
CN101449522B (zh) 实施免提操作环境的系统和方法
Tashev et al. Commute UX: Voice enabled in-car infotainment system
JP2002281145A (ja) 電話番号入力装置
JP2016178662A (ja) 車載装置、情報処理方法および情報処理システム
US20090036169A1 (en) Motor vehicle cordless hands-free kits
KR20090011756A (ko) 와이브로를 이용한 차량용 멀티미디어 시스템
US20100062848A1 (en) Vehicle entertainment system operable by a remote device and method for remotely operating a vehicle entertainment system
JP2006003321A (ja) 車両用情報提供システム
JP3987402B2 (ja) Avm移動局装置
KR101121291B1 (ko) 핸즈프리 단자를 이용한 휴대폰 데이터의 재생 장치 및 그방법
JP6509077B2 (ja) 情報処理装置
KR200373011Y1 (ko) 차량용 음성인식 핸즈프리 장치
JP2019126037A (ja) 携帯端末装置、携帯端末装置の制御方法およびプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant