CN1095563C - 向被声音启动的数据处理系统发送声音样本的方法和装置 - Google Patents

向被声音启动的数据处理系统发送声音样本的方法和装置 Download PDF

Info

Publication number
CN1095563C
CN1095563C CN96195188A CN96195188A CN1095563C CN 1095563 C CN1095563 C CN 1095563C CN 96195188 A CN96195188 A CN 96195188A CN 96195188 A CN96195188 A CN 96195188A CN 1095563 C CN1095563 C CN 1095563C
Authority
CN
China
Prior art keywords
speech recognition
transmitting device
voice
recognition system
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN96195188A
Other languages
English (en)
Other versions
CN1189900A (zh
Inventor
乔伊·李·克里那
斯考特·哈兰·伊森斯
里奇·李·珀斯通
乔恩·哈拉尔德·韦那
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1189900A publication Critical patent/CN1189900A/zh
Application granted granted Critical
Publication of CN1095563C publication Critical patent/CN1095563C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/20Individual registration on entry or exit involving the use of a pass
    • G07C9/22Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder
    • G07C9/25Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder using biometric data, e.g. fingerprints, iris scans or voice recognition
    • G07C9/257Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder using biometric data, e.g. fingerprints, iris scans or voice recognition electronically
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

本发明为一种把被分析的声音样本从用户携带的无线传输装置传送给带有语音识别系统的远程声音启动的数据处理系统的装置和方法。该方法包括的第一步骤是把用户的声音特征存贮到无线传输装置的存储器(例如RAM芯片)中。第二步骤包括用声音启动传输装置和语音识别系统。在传输装置和语音识别系统被启动之后,其第三步骤包括把声音特征从存储器传送给语音识别系统,从而使用户能与被声音启动的处理系统直接进行口头通信。

Description

向被声音启动的数据处理系统 发送声音样本的方法和装置
本发明涉及改进与语音识别系统的通信,更具体地说,是涉及向一个数据处理系统的一个依赖于说话者的语音识别系统传送声音样本的方法和装置,但不限于此。
口语在人与人的通信以及人-机通信和机-人通信当中起到重要作用。例如,现代语音邮件系统、帮助系统、以及电视会议系统都把人的语音包括进去了。再有,随着技术继续更新,人的语音将在机/人通信中发挥更大的作用。特别是可以预见,一个无线ATM机(自动取款机)(或任何类型的无线机,如油泵、旅行信息亭、销售端点)将包含一个语音识别系统,从而用户只需向ATM机说话。本发明试图使用户容易而有效地与这类机器进行口头通信,而无需向这种机器插入卡片或任何其它类型的装置。
传统的语音识别装置“听取”并理解人的语音。然而,为了具有可以接受的声音识别精度,传统的语音识别系统利用了所存储的用户声音样本。用户朗诵30个左右精心构造的句子,这些句子能抓住足够的声音特征,从而产生出声音样本。语音特征含有用户语音的韵律学特征,包括节奏、音调、变音和速度。传统的语音分析器处理语音样本,分离出每个双音(diphone)段的音频样本并确定特征韵律曲线。语音分析器使用众所周知的数字信号处理技术例如隐式马尔可夫模型,以产生出双音段和韵律曲线。所以,利用存储的语音样本,传统的语音识别系统有大约90%的准确率。然而,若每次用户想与一无线机器进行口头通信时都需要重复那30个句子,这将是很不利的。
根据所给出的背景信息,对于大量用户而言,将会特别希望能够高效率地、有效地通过语音与无线交互相器进行远程通信,这对于他们是特别有利的。然而,这必须开发出一种技术或装置,使得在用户能以高准确率与机器进行口头通信之前,把分析过的用户声音样本传送给该机器。
本发明的第一方面的发明提供了一种方法,用于改善与至少一个远程声音启动数据处理系统的声音通信。该处理系统中具有一个语音识别系统。该方法包括以下步骤:
(a)把用户的声音特征存贮在一个无线传输装置的存储器中;
(b)响应声音启动命令,用声音启动该无线传输装置和远程语音识别系统;以及
(c)响应对无线传输装置和语音识别系统的启动,将声音特征从存储器传送给语音识别系统,从而使用户能与被声音启动的处理系统直接进行口头通信。
本发明第二方面的发明提供了一种声音传输系统,该系统使与设在远程数据处理系统中的远程语音识别系统进行声音通信成为可能,该声音传输系统包括:
无线传输装置,其中有存储器用于存贮用户的声音特征;
该无线传输装置和语音识别系统适应于响应由无线传输装置收到的声音启动命令,从而被启动;以及
该无线传输装置适应于响应启动语音识别系统和无线传输装置,以从存储器向语音识别系统传送声音特征,从而使用户能直接与语音识别系统进行口头通信。
在本发明的一个最佳实施例中,一种装置和由计算机实现的方法把被分析的声音样本从用户携带的无线传输装置传送给远程数据处理系统,该系统具有语音识别系统以读取声音样本。该方法包括的第一步骤是把一组用户声音特征存储到无线传输装置的一个存储器(例如一个RAM(随机存取存储器)芯片)中。第二步骤包括响应声音命令用声音启动传输装置和远程语音识别系统。在传输装置和语音识别系统已被启动之后,其第三步骤包括自动地从存储器到语音识别系统远程传送声音特征,从而使得用户能直接与被启动的数据处理系统进行口头通信。
本发明提供一种改进的声音传输系统,它响应预先定义的声音命令,自动地把用户的声音特征传输给一个无线数据处理系统。
本发明还提供一种装置(例如传输装置),用于存储用户的声音特征和把声音特征传送给数据处理系统,还提供一种装置用于启动数据处理系统去等待和接收这个声音特征。
现在将参考附图以实例更详细地描述本发明。
图1显示实现本发明的代表性硬件环境的方框图。
图2显示了根据本发明的改进的声音传输系统的方框图。
图3显示了一个用户携带无线传输装置与远程数据处理系统通信的情况。
图4显示了从无线传输装置向远程数据处理系统传送声音特征的流程图。
本发明的最佳实施例包括把含有用户声音特征的声音样本远程自动传送给语音识别系统的方法和装置。
该最佳实施例是在膝上计算机或工作站(如图1所示)中实现的。工作站100包括中央处理单元(CPU)10(例如IBMTM的Power PCTM601或IntelTM486微处理器)用于处理高速缓存器15,随机存取存储器(RAM)14,只读存储器16,以及非易失RAM(NVRAM)32。由I/O适配器18控制的一个或多个磁盘20提供了长期存储能力。多种其他存储介质也可以利用,包括磁带、CD-ROM、以及WORM驱动器。也可以提供可拆卸存储介质,以存储数据或计算机处理指令。
来自采用任何适当操作系统(如Sun SolarisTM,MicrosoftWindows NTTM,IBM OS/2TM,或Apple MAC OSTM)的桌上型计算机的指令和数据通过RAM14控制CPU10。然而,本行业的熟练人员不难认识到,其他硬件平台和操作系统也可以用来实现本发明。
用户通过由用户接口适配器22控制的I/O装置(即用户控制器)与工作站100进行通信。显示器38向用户显示信息,而键盘24、指点装置26、传输装置30及扬声器28则让用户去指挥计算机系统。也可以利用其他类型的用户控制器,如游戏棒、触摸屏、或虚拟现实头戴送受话器(headset)(图中未画出)。通信适配器34控制该计算机系统和由网络适配器40连到网络上的其他处理单元之间的通信。显示适配器36控制该计算机系统和显示器38之间的通信。
图2显示出根据该最佳实施例的一个完整的声音传输系统200的方框图。传输系统200包括声音特征提取器210、传输装置220以及语音识别系统230。声音特征提取器210装在任何适当的工作站(如图1所示工作站100)中,包括模数转换(A/D)子系统204、语音分析器206以及语音压缩电路207。
图4显示出从无线传输装置向远程数据处理系统传送声音特征的流程图。参考图2和图4,在本实施例中,用户把包含说话者足够的声音特征的声音样本(例如大约30个句子)通告给话筒202(步骤410)。声音特征包括声音的韵律,例如节奏、音调、变音和速度。这类句子对于语言合成技术专家而言是公知的。例如,一个句子可以是“The quickfox jumped over the lazy brown dog”(敏捷的狐狸跃过了褐色的懒狗)”。A/D子系统204(和222)对声音样本取样和数字化,该子系统可包括任何适当的模拟-数字系统,如IBM的MACPA(即多媒体音频接收和回放适配器),Creative Labs的声霸(Sound Blaster)声卡或单片机解决方案(步骤412)。
接下来,任何适当的传统的语音分析器206对被数字化的声音样本进行处理,以把每个双音段的音频样本隔离开并确定韵律曲线(步骤414)。语音分析器206使用众所周知的数字信号处理技术,例如隐式马尔可夫模型,以产生双音段和韵律曲线。美国专利4,961,229号和3,816,722号描述了合适的语音分析器。
语音编码电路207利用传统的数字编码技术压缩双音段和韵律曲线,从而降低对传输带宽和存储的要求(步骤416)。语音编码电路207把得到的被压缩韵律曲线和双音段存储在传输装置220的RAM226(例如存储器)中。本专业专家会认识到,可以用任何适当类型的存储器装置代替RAM226,例如流水线短时脉冲存储器(Pipeline burstmemory),快闪存储器,或缩小尺寸的DASD。传输装置220还包括由声音启动的用于接收声音启动命令的话筒221、A/D子系统222、语音识别电路224、电源(未画出),处理器228以及传输单元229。
图3显示出一用户携带无线传输装置220与一远程数据处理系统310通信的情况。参考图2、3、4,在该最佳实施例中,用户携带传输装置220与携带一枚胸针类似。另一种方法是用户能把传输装置220带在他/她的嘴上。当用户希望与远程数据处理系统(例如自动取款机(ATM))310中的语言识别系统230通信时,用户(他携带着传输装置220)靠近远程数据处理系统310并把一个声音启动命令(例如“COMPUTER(计算机)”;“LOGON COMPUTER(登录计算机)”)朗读到传输装置220的声音启动话筒221中。(步骤418)。说明这一点是重要的,即“无线”的含义是数据处理系统310与传输装置220之间是无线的。由声音启动的话筒221检测声音启动命令,而A/D子系统222则对那个声音启动命令进行采样和数字化。A/D子系统221把被数字化的声音启动命令发送给语音识别电路224。
语音识别电路224(及234)包括任何适当的声音识别电路,如IBM的Voice type DictationTM(声控)产品或Dragon voice Recognitionsystem(龙牌声音识别系统)中的声音识别电路。如果语音识别系统224识别出了这个声音启动命令,它便向处理器228发送一个指示这一命令的信号。处理器228响应这一信号,向传输单元229发送一个信号,以把该声音启动命令传送给语音识别系统230的接收单元232(步骤420)。传输单元229可以是任何适当类型的无线传输单元(例如激光、红外光发射二极管);然而,在该最佳实施例中,传输单元229是一个射频(RF)发射机。处理器228向RAM226发送一个短的暂停(time out)信号,以让语音识别系统230被唤醒(步骤422)。
语音识别系统230包括接收单元232,语音解压电路233以及语音识别电路234。系统230可放在任何适当的工作站(例如工作站100)中。接收单元232把收到的声音启动命令发送给语音解压电路233,在那里它被解压。语音解压电路233把声音启动命令发送给声音识别电路234。如果语音识别电路234识别出这个声音启动命令,它便被启动并等待接收来自传输装置220的韵律曲线和双音段。于是,单一的声音启动命令启动了传输装置220和语音识别系统230。所以,在经过程时暂停之后,处理器228指示RAM226通过传输单元229和接收单元232把韵律曲线和双音段发送给语音识别电路234(步骤424和426)。语音识别是电路234使用那些韵律曲线和双音段来识别用户的声音。现在用户可以直接对语音识别系统230讲话了。
因此,该最佳实施例把用户的声音特征传送给一个无线远程机器,这只需要用户朗读一个声音启动命令而无需做任何其他事情。不需插入卡片。所以,用户能同时启动不止一个无线远程数据处理系统,而靠插入卡片是不可能实现这一点的。
尽管已经参考具体实施例显示和描述了本发明,但本行业的熟练人员会理解,在本发明的范围内可以在形式和细节上做出前述的和其他的改变。

Claims (11)

1.一种改善与至少一个带有语音识别系统的远程声音启动数据处理系统进行声音通信的方法,包括以下步骤:
(a)把用户的声音特征存贮在一个无线传输装置的存储器中;
(b)响应声音启动命令,用声音启动该无线传输装置和远程语音识别系统;以及
(c)响应对无线传输装置和语音识别系统的启动,将声音特征从存储器传送给语音识别系统,从而使用户能与被声音启动的处理系统直接进行口头通信。
2.根据权利要求1的方法,其中步骤(a)包括下列步骤:
获取用户的声音样本;
对获取的声音样本进行数字化,从而构成被数字化的声音;
利用语音分析器从数字化声音中提取声音特征;以及
把声音特征存贮在存储器中。
3.根据权利要求1或权利要求2的方法,其中步骤(b)包括下列步骤:
由无线传输装置接收来自用户的声音启动命令以唤醒传输装置;以及
把该声音启动命令从无线传输装置传送给语音识别系统以唤醒该语音识别系统。
4.根据权利要求3的方法,其中步骤(b)还包括如下步骤:
从无线传输装置向存储器发一个信号,以允许在传输声音特征之前使语音识别系统被唤醒。
5.根据权利要求4的方法,其中步骤(c)包括以下步骤:
从处理器向存储器发送一个信号以把声音特征传送给语音识别系统。
6.一种声音传输系统,用于使能与放在远程数据处理系统中的远程语音识别系统进行声音通信,该声音传输系统包括:
无线传输装置,其中有存储器用于存贮用户的声音特征;
该无线传输装置和语音识别系统适应于响应由无线传输装置收到的声音启动命令,从而被启动;以及
该无线传输装置适应于响应启动语音识别系统和无线传输装置,以从存储器向语音识别系统传送声音特征,从而使用户能直接与语音识别系统进行口头通信。
7.根据权利要求6的系统,还包括:
声音特征提取器,用于从用户的声音样本中产生声音特征。
8.根据权利要求6或权利要求7的系统,这里无线传输装置的组成包括:用于接收声音启动命令的话筒,用于识别该声音命令的语音识别电路,以及用于把收到的声音启动命令传送给语音识别系统的传输单元。
9.根据权利要求8的系统,其中的传输单元由一个射频(RF)发射机构成。
10.根据权利要求8的系统,其中的无线传输装置还包括一个处理器,用于控制存储器和传输单元。
11.根据权利要求9的系统,其中的无线传输装置还包括一个处理器,用于控制存储器和传输单元。
CN96195188A 1995-06-30 1996-06-27 向被声音启动的数据处理系统发送声音样本的方法和装置 Expired - Lifetime CN1095563C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/497,302 1995-06-30
US08/497,302 US5704009A (en) 1995-06-30 1995-06-30 Method and apparatus for transmitting a voice sample to a voice activated data processing system

Publications (2)

Publication Number Publication Date
CN1189900A CN1189900A (zh) 1998-08-05
CN1095563C true CN1095563C (zh) 2002-12-04

Family

ID=23976298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96195188A Expired - Lifetime CN1095563C (zh) 1995-06-30 1996-06-27 向被声音启动的数据处理系统发送声音样本的方法和装置

Country Status (12)

Country Link
US (1) US5704009A (zh)
EP (1) EP0836720B1 (zh)
JP (1) JP3335178B2 (zh)
KR (1) KR100297076B1 (zh)
CN (1) CN1095563C (zh)
CA (1) CA2220861C (zh)
CZ (1) CZ287316B6 (zh)
DE (1) DE69606042T2 (zh)
HU (1) HUP9801839A3 (zh)
PL (1) PL182225B1 (zh)
TW (1) TW366483B (zh)
WO (1) WO1997002526A1 (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3697748B2 (ja) * 1995-08-21 2005-09-21 セイコーエプソン株式会社 端末、音声認識装置
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
US5940476A (en) 1996-06-28 1999-08-17 Distributed Software Development, Inc. System and method for identifying an unidentified caller
US5901203A (en) 1996-06-28 1999-05-04 Distributed Software Development, Inc. Computer-based system and method for identifying an unidentified caller
US6205204B1 (en) 1996-06-28 2001-03-20 Distributed Software Development, Inc. System and method for identifying an unidentified person using an ambiguity-resolution criterion
US7006605B1 (en) * 1996-06-28 2006-02-28 Ochopee Big Cypress Llc Authenticating a caller before providing the caller with access to one or more secured resources
US6529881B2 (en) * 1996-06-28 2003-03-04 Distributed Software Development, Inc. System and method for identifying an unidentified customer at the point of sale
JPH10178490A (ja) * 1996-10-15 1998-06-30 Casio Comput Co Ltd 音声記憶システム
JPH10260692A (ja) * 1997-03-18 1998-09-29 Toshiba Corp 音声の認識合成符号化/復号化方法及び音声符号化/復号化システム
US7383200B1 (en) 1997-05-05 2008-06-03 Walker Digital, Llc Method and apparatus for collecting and categorizing data at a terminal
US6567787B1 (en) 1998-08-17 2003-05-20 Walker Digital, Llc Method and apparatus for determining whether a verbal message was spoken during a transaction at a point-of-sale terminal
US5987405A (en) * 1997-06-24 1999-11-16 International Business Machines Corporation Speech compression by speech recognition
US6003004A (en) * 1998-01-08 1999-12-14 Advanced Recognition Technologies, Inc. Speech recognition method and system using compressed speech data
GB9824762D0 (en) * 1998-11-11 1999-01-06 Ncr Int Inc Self-service terminal
US6260016B1 (en) 1998-11-25 2001-07-10 Matsushita Electric Industrial Co., Ltd. Speech synthesis employing prosody templates
US6195636B1 (en) 1999-02-19 2001-02-27 Texas Instruments Incorporated Speech recognition over packet networks
US6185533B1 (en) 1999-03-15 2001-02-06 Matsushita Electric Industrial Co., Ltd. Generation and synthesis of prosody templates
NL1012860C2 (nl) * 1999-08-19 2001-02-20 Nedap Nv Boerderijautomatiseringssysteem.
EP1120752A1 (de) * 2000-01-24 2001-08-01 Franke & Co. Verwaltungs KG System zur Kontrolle von Zugangs- bzw. Zugriffsberechtigungen
DE10003617A1 (de) * 2000-01-28 2001-08-02 Volkswagen Ag Verfahren und Vorrichtung zur Spracheingabe bei Autoradios
US20060011045A1 (en) * 2002-08-22 2006-01-19 Atsushi Yamashita Control system, method, and program using rhythm pattern
US20060173681A1 (en) * 2005-02-01 2006-08-03 Bae Systems Information And Electronic Systems Integration Inc Semi-covert emergency transmitter
US20070083367A1 (en) * 2005-10-11 2007-04-12 Motorola, Inc. Method and system for bandwidth efficient and enhanced concatenative synthesis based communication
US10257191B2 (en) 2008-11-28 2019-04-09 Nottingham Trent University Biometric identity verification
US9059991B2 (en) 2008-12-31 2015-06-16 Bce Inc. System and method for unlocking a device
WO2011082521A1 (en) * 2010-01-06 2011-07-14 Zoran Corporation Method and apparatus for voice controlled operation of a media player
KR101262700B1 (ko) * 2011-08-05 2013-05-08 삼성전자주식회사 음성 인식 및 모션 인식을 이용하는 전자 장치의 제어 방법 및 이를 적용한 전자 장치
EP3413575A1 (en) 2011-08-05 2018-12-12 Samsung Electronics Co., Ltd. Method for controlling electronic apparatus based on voice recognition and electronic apparatus applying the same
CN102436813A (zh) * 2011-12-21 2012-05-02 成都众询科技有限公司 一种可控语音控制系统
KR20130133629A (ko) 2012-05-29 2013-12-09 삼성전자주식회사 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
US9135915B1 (en) * 2012-07-26 2015-09-15 Google Inc. Augmenting speech segmentation and recognition using head-mounted vibration and/or motion sensors
CN106296867B (zh) * 2015-06-11 2019-09-06 杭州萤石网络有限公司 影像记录设备及其影像标记方法
CN107256707B (zh) * 2017-05-24 2021-04-30 深圳市冠旭电子股份有限公司 一种语音识别方法、系统及终端设备
US10283117B2 (en) * 2017-06-19 2019-05-07 Lenovo (Singapore) Pte. Ltd. Systems and methods for identification of response cue at peripheral device
JP7044633B2 (ja) * 2017-12-28 2022-03-30 シャープ株式会社 操作支援装置、操作支援システム、及び操作支援方法
CN109065058B (zh) * 2018-09-30 2024-03-15 合肥鑫晟光电科技有限公司 语音通信方法、装置及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0633520A1 (en) * 1993-07-01 1995-01-11 Koninklijke Philips Electronics N.V. Remote control having voice input
EP0653701A1 (en) * 1993-11-15 1995-05-17 International Business Machines Corporation Method and system for location dependent verbal command execution in a computer based control system
WO1995015663A1 (en) * 1993-12-01 1995-06-08 Nhc Corporation Wireless remote switching system

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5444673A (en) * 1994-07-12 1995-08-22 Mathurin; Trevor S. Audio controlled and activated wristwatch memory aid device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0633520A1 (en) * 1993-07-01 1995-01-11 Koninklijke Philips Electronics N.V. Remote control having voice input
EP0653701A1 (en) * 1993-11-15 1995-05-17 International Business Machines Corporation Method and system for location dependent verbal command execution in a computer based control system
WO1995015663A1 (en) * 1993-12-01 1995-06-08 Nhc Corporation Wireless remote switching system

Also Published As

Publication number Publication date
CZ395397A3 (cs) 1999-01-13
JP3335178B2 (ja) 2002-10-15
KR100297076B1 (ko) 2001-08-07
HUP9801839A3 (en) 2002-09-30
PL324025A1 (en) 1998-05-11
KR19990022423A (ko) 1999-03-25
DE69606042T2 (de) 2000-10-26
US5704009A (en) 1997-12-30
EP0836720A1 (en) 1998-04-22
CA2220861C (en) 2002-11-05
JPH10507559A (ja) 1998-07-21
WO1997002526A1 (en) 1997-01-23
HUP9801839A2 (hu) 1998-11-30
CN1189900A (zh) 1998-08-05
DE69606042D1 (de) 2000-02-10
EP0836720B1 (en) 2000-01-05
PL182225B1 (pl) 2001-11-30
CZ287316B6 (en) 2000-10-11
CA2220861A1 (en) 1997-01-23
TW366483B (en) 1999-08-11

Similar Documents

Publication Publication Date Title
CN1095563C (zh) 向被声音启动的数据处理系统发送声音样本的方法和装置
CN110049270B (zh) 多人会议语音转写方法、装置、系统、设备及存储介质
US8224647B2 (en) Text-to-speech user's voice cooperative server for instant messaging clients
EP0789349B1 (en) Pattern matching method and apparatus thereof
US5696879A (en) Method and apparatus for improved voice transmission
US20030182113A1 (en) Distributed speech recognition for mobile communication devices
US20070118373A1 (en) System and method for generating closed captions
US20070274296A1 (en) Voip barge-in support for half-duplex dsr client on a full-duplex network
CN1934848A (zh) 用于语音交互式消息传送的方法和设备
JP2002540477A (ja) クライアント−サーバ音声認識
JPH06214587A (ja) 事前指定ワードスポッティングサブシステム及び事前ワードスポッティング方法
WO1996003741A1 (en) System and method for facilitating speech transcription
WO1996003741A9 (en) System and method for facilitating speech transcription
KR950014504B1 (ko) 전자문서를 음성 처리하는 휴대용 컴퓨터 디바이스
KR100868709B1 (ko) 불리한 환경에서 동양 문자를 위한 하이브리드키패드/음성 인식 테크닉
US7092884B2 (en) Method of nonvisual enrollment for speech recognition
Sharman Speech interfaces for computer systems: Problems and potential
EP1213707B1 (en) Pattern matching method and apparatus and telephony system
WO2001039177A2 (en) Distributed speech recognition for mobile communication devices
CA2558279A1 (en) Scheduler for audio pattern recognition
Ribeiro et al. " iwscy is.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: NEW ANST COMMUNICATION CO.,LTD.

Free format text: FORMER OWNER: INTERNATIONAL BUSINESS MACHINE CORP.

Effective date: 20090911

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090911

Address after: Massachusetts, USA

Patentee after: Nuance Communications Inc

Address before: American New York

Patentee before: International Business Machines Corp.

CX01 Expiry of patent term

Granted publication date: 20021204

EXPY Termination of patent right or utility model