CN1101446A - 语音教学计算机化系统 - Google Patents

语音教学计算机化系统 Download PDF

Info

Publication number
CN1101446A
CN1101446A CN94102645A CN94102645A CN1101446A CN 1101446 A CN1101446 A CN 1101446A CN 94102645 A CN94102645 A CN 94102645A CN 94102645 A CN94102645 A CN 94102645A CN 1101446 A CN1101446 A CN 1101446A
Authority
CN
China
Prior art keywords
sample
user
sample sound
sound
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN94102645A
Other languages
English (en)
Inventor
齐夫·施皮罗
加布里埃尔·F·格罗尼尔
埃里克·奥登特里齐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSP Solutions International
Original Assignee
DSP Solutions International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSP Solutions International filed Critical DSP Solutions International
Publication of CN1101446A publication Critical patent/CN1101446A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student
    • G09B7/04Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student characterised by modifying the teaching programme in response to a wrong answer, e.g. repeating the question, supplying a further explanation
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/04Speaking
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages

Abstract

一种用于语音和发音训练的改进的计算机化系 统,它将录制的参考语音样本提供给学生,并且将学 生的重发与原来提供的参考语音样本之间的相似度 的量化显示给使用者。

Description

本发明一般地涉及教学系统并且更特别地涉及用于语音教学的计算机化系统。
近年来在计算机化语音教学领域已有了许多进展。将例如预录制的声音和单词的提示和插入信号提供给学生并录制或监听学生们的发音的语音实验室是众所周知的。
由IBM公司投放市场的语音观察器Ⅱ(Speech Viewer Ⅱ)是一种语音疗法(speech therapy)产品,它提供学生发声的视听反馈。
在下列出版物中描述了用于计算机化语音识别的公知方法和装置,其公开的内容在这里参考引用:
Flanagan,J.L.“听说计算机:通过话音的人机通信”,Proc IEEE,64卷,1976年,405-415页;
Itakura,F.“应用于语音识别的最小预测残差原理”,IEEE Trans,Acoustics,speech and Signal Processing,1975年2月一描述了一种时间校准算法和一种计算距离量度的方法;
Le Roux,J.和Gueguen,C.“一种部分相关系数的定点计算”,IEEE ASSP,1977年6月;
Peacocke,R.D.和Graf,D.H,“一种语音及说话者识别介绍”,IEEE Computer,23(8)卷,1990年8月,26-33页;
L.R.Rabiner等,“采用群集技术的孤立单词的非特定人识别”,IEEE Trans,Acoustics,Speech and Signal Processing,ASSP-27卷,第4期,1979年8月,336-349页;
Rabiner,L.R,Levison,S.E.和Sondhi,M.M,“向量量化和隐式马尔可夫模型应用于非特定人、孤立单词识别”,Bell Systems Tech J.,62(4)卷,1983年4月,1075-1105页;
Rabiner L.R.,和Sanbur M.R,“一种确定孤立发音终点的算法”,Bell Systems Tech J,1975年2月;
Rabiner,L.R和Wilpon,J.G.,“一种用于说话者训练的孤立单词识别系统的简化的鲁棒训练程序”,J.Acoustical Society of America,1980年11月。
所有上述出版物公开的内容在这里参考引用。
本发明试图提供一种改进的用于语音和发音教学的计算机化系统,其中已录制的参考语音样本提供给学生并且将学生的重复与原来提供的参考语音样本之间的相似度的量化显示给使用者。
本发明也试图提供一种语音和发音教学系统,它特别适合于非特定人语音学习并且无需经过训练的人的语音和发音专家的参与。本发明的系统最好包括口头提示,它指导使用者通过一个教学系统而无需依靠一个教师而进行学习。最好对学生的表现进行监视并且口头提示序列的转移应考虑学生的表现。例如,预定类型的学生错误(例如一个特定语音的重复错误发音)可以从学生语音响应中抽取出来,并且口头提示序列可以转移到考虑每一种类型学生错误的出现或不出现的情形。
本发明也试图提供一种语音和发音教学系统,它特别适合于本国语说话者学习外语的优选发音的教学。最好,本发明的系统包括一个以多种语言和一个多语言信息提供的初始菜单,它提示使用者选择代表其本国语的菜单。根据使用者的本国语的选择,系统最好以其本国语操作目前的连续口头信息给使用者,和/或转移口头信息序列以考虑公知的使用者的本国语的说话者频繁发生的语言特征(例如发音错误)。例如,当以日语为本国语的说话者说英语时,常常混淆L和R声以及短I和长E声(例如在单词“ship”和“sheep”中)。以阿拉伯语和德语为本国语的说话者没有这些问题。
因此根据本发明的一个优选实施例,提供了交互式语音训练的装置,它包括一个声音样本发生器和一个声音样本记分器,声音样本发生器给使用者播放预先录制好的参考声音样本从而让使用者尝试着重发,声音样本记分器对使用者的重发声音样本进行记分。
此外,根据本发明的一个优选实施例,声音样本记分器包括一个参考/响应比较单元和一个相似度指示器,参考/响应比较单元将使用者的重发声音样本的至少一个特征与参考声音样本的至少一个特征进行比较,相似度指示器提供重发声音样本的至少一个特征与参考声音样本的至少一个特征之间的相似度的输出指示。
此外,根据本发明的一个优选实施例,本装置还包括一个使用者响应存储器,它用于存储参考声音样本的使用者的重发,参考/响应比较单元可以利用使用者响应存储器。
另外,根据本发明的一个优选实施例,参考/响应比较单元包括一个音量/持续时间校正器,它将参考和重发声音样本的间量和持续时间校正。
此外,根据本发明的一个优选实施例,参考/响应比较单元包括一个参数化单元,它从参考和重发声音样品中抽取声音信号参数。
另外,根据本发明的一个优选实施例,参考/响应比较单元还包括将参考声音样本参数与重发声音样本参数进行比较的装置。
此外,根据本发明的一个优选实施例,用于比较的装置包括一个参数分数发生器,它提供一个表示参考与重发声音样本的声音信号参数之间的相似度的分数。
此外,根据本发明的一个优选实施例,输出指示包括分数的显示。
根据本发明的另一个实施例,输出指示包括至少一个声音波形的显示。
此外,根据本发明的一个优选实施例,交互式语音训练装置包括一个提示序列发生器,它产生给使用者的提示序列。
此外,根据本发明的一个优选实施例,交互式语音训练装置还包括一个参考声音样本库,其中存储着参考声音样本并且声音样本发生器可以利用参考声音样本库。
另外,根据本发明的一个优选实施例,参考声音样本库包括由多个语音模型产生的许多声音样本的录音。
此外,根据本发明的一个优选实施例,多个语音模型在以下特征:性别、年龄和方言中的至少一项是相互不同的。
根据本发明的又一个优选实施例,还提供了用于交互式语音训练的装置,它包括一个提示序列发生器和一个参考/响应比较单元,提示序列发生器产生给使用者的提示序列并提示使用者产生相应的声音样本序列,参考/响应比较单元将由使用者产生的每一个声音样本序列的至少一个特征与一个参考信号进行比较。
此外,根据本发明的一个优选实施例,将单个使用者产生的声音样本与参考信号比较的参考信号包括一个相应的存储参考声音样本。
此外,根据本发明的一个优选实施例,提示序列根据使用者的表现而转移。
另外,根据本发明的一个优选实施例,提示序列至少部分地由使用者指定的本国语确定。
此外,根据本发明的一个优选实施例,提示序列发生器包括一个多语言提示序列库,其中存储着以多种语言表示的多个提示序列,并且提示序列发生器根据使用者指定的其本国语的单一语言产生多种语言中的一种单一语言的提示序列。
根据本发明的另一个优选实施例,还提供了用于交互式语音训练的装置,它包括一个声音样本录音机和一个参考/响应比较单元,声音样本录音机用于录制由使用者产生的声音样本,参考/响应比较单元将使用者产生的声音样本的至少一个特征与一个参考信号进行比较。比较单元包括一个声音样本分段器和一个段比较单元,声音样本分段器用于将使用者产生的声音样本分成多个段,段比较单元用于将多个段中的至少一个中的至少一个特征与一个参考信号进行比较。
此外,根据本发明的一个优选实施例,声音样本分段器包括一个语音分段器,它将使用者产生的声音样本分成多个语音段。
另外,根据本发明的一个优选实施例,至少一个语音段包括一个语音(例如一个元音或辅音)。
根据本发明的另一个优选实施例,至少一个语音段可以包括一个音节。
根据本发明的又一个实施例,提供了用于交互式语音训练的装置,它包括一个声音样本录音机和一个非特定人声音样本记分器,声音样本录音机用于录制使用者产生的声音样本,非特定人声音样本记分器根据至少一个非特定人参数对使用者产生的声音样本进行记分。
此外,根据本发明的一个优选实施例,至少一个非特定人参数包括一个用于一个预定频率上的能量数值的阀值。
此外,根据本发明的一个优选实施例,本装置还包括一个常规的个人计算机。
从以下结合附图的详细描述将理解和欣赏本发明,其中:
图1是根据本发明的一个优选实施例构造和操作的一个交互式语音教学系统的一般图示的示意图;
图2是图1系统的一个简化框图;
图3是图1系统中的一个部件的简化框图;
图4是显示用于本发明的预录制材料制备的一个简化流程图;
图5A与5B合起来是显示图1和图2装置的操作的一个简化流程图;
图6是一个语音模型重发单词“CAT”0.5秒的一个曲线图(声音幅度对时间(秒));
图7是一个语音模型重发元音“A”0.128秒的由图6导出的一个曲线图(声音幅度对时间(秒));
图8是一个学生尝试着重发单词“CAT”0.5秒的曲线图(声音幅度对时间(秒));
图9是一个学生尝试着重发元音“A”0.128秒的由图8导出的曲线图(声音幅度对时间(秒));
图10是一个学生尝试着重发单词“CAT”0.35秒的曲线图(声音幅度对时间(秒));
图11是一个学生尝试着重发元音“A”0.128秒的由图10导出的曲线图(声音幅度对时间(秒))。
现在参看图1和图2,它们显示了根据本发明的一个优选实施例构造和操作的一个交互式语音教学系统。图1和图2的系统最好基于一个常规个人计算机10,例如一台IBM PC-AT,并且最好配备有一个辅助声音组件12。例如,一个合适的声音组件12是由美国加利福尼亚州帕洛阿尔托的Digispeech公司制造的DS201并且在商业上可从IBM教学系统中获得。一个耳机14最好与声音组件12相连接。
正如可以从图1看到,可选择地设有一台显示器30,它显示预录制的参考声音样本32和学生尝试重发34的校正声音波形。典型地显示有定量表示重发与参考声音样本之间的随时间的相似度的分数40,以给学生提供反馈。
可以采用任何合适的方法来产生相似度分数40,例如常规的相关法。在由Itakura所著的上述参考文献中描述了一种合适的方法,其公开的内容在这里参考引用。为了采用Itakura描述的距离量度,从语音信号中抽取一阶线性预测系数。然后采用一种动态规划算法来计算学生的重复与一组模型之间的距离,即学生的重复与这些模型的相关程度。
最好,在图1的计算机10中装入合适的软件以执行图2的功能框图中提出的操作。另外,图2的结构也可以包括在一个常规的硬连线电路中。
现在参考图2的框图。图2的装置包括一个参考声音样本放音机100,可操作它给学生110播放参考声音样本。典型地通过多个语音模型的每一个预录制许多语音、单词和/或短语的每一个参考声音样本并且被存储在一个参考语音样本库120中。参考声音样本放音机100可以利用参考声音样本库120。
学生110尝试着重发每一个参考声音样本。他的口头尝试由学生响应样本接收机130接收并且最好由一个数字化转换器140数字化并存储在一个学生响应样本存储器150中。来自存储器150的每一个存储的学生响应在一个学生响应样本放音机154上可选择地放音给学生。当然,放音机100和154不必是分离的部件,图中所示的分离的方框只是为了清楚起见。
一个学生响应样本记分单元160通过利用学生响应样本接收机130用来评价参考声音样本。通过将学生的响应与由库120存取的相应参考声音样本进行比较来计算分数。
根据一个参考样本的学生响应来评价有时比最佳结果差一些,这是因为由一个单一语音模型产生的单一参考样本不能精确地表示该样本的最佳发音。因此,可选择地或者另外,通过根据一个非特定人参考信号(例如存储在一个非特定人参数数据库170中的一组非特定人参数)评价学生响应,可以计算学生响应的分数。
根据本发明的一个优选实施例,数据库170中的非特定人参数对于说话者的年龄、性别和/或方言是特定的。换句话说,在每一个单独类型的特定的年龄、性别和/或方言的个人范围内,这些参数是与说话者无关的。
一个非特定人参数的例子是在一个取决于声音样本的特定频率上高能量的出现。例如在图6中,“猫”(CAT)波形包括第一和第三高频率、低能量部分和一个介于第一和第三部之间的且中频率、高能量的第二部分。第一和第三部分相应于CAT中的C和T声。第二部分相应于A声。
可以采用频率分析来评价响应样本。可以计算特定人参数(例如共振频率或线性预测系数),因而计算的数值可以与已知的正常范围进行比较。
学生响应样本记分单元160将参照图3进行更详细的描述。
由记分单元160导出的学生响应分数或评价在一个显示器(例如一个电视屏幕)180上显示给学生。最好,分数或评价也存储在一个学生跟踪数据库190中,数据库190累积有关每一个单独的学生为了跟踪目的的进展的信息。
系统与学生的接口最好由一个提示序列发生器200间接,可以操作提示序列发生器200给学生产生提示(例如语言提示),它既可以显示在显示器180上也可以可听地提供给学生。最好,提示序列发生器从记分单元160接收学生的分数,并可操作之将提示序列分支并将参考声音要样本提供给由其分数表明的相应的学生的进展。
根据本发明的一个优选实施例,提示序列发生器初始时给学生提供一个菜单,通过这个菜单学生可以指定其本国语。提示序列发生器最好以下列方式中的至少一种考虑学生的本国语:
(a)语言提示以其本国语提供给使用者。每一个提示以由系统支持的多个本国语的每一种语言存储在一个多语言提示库210中,提示序列发生器200可以利用多语言提示库210。
(b)提示序列和参考声音样本部分地由本国语指定而确定。例如,以希伯来语为本国语的说话者难以发英语的R声。因此,对于说希伯来语的人来说,提示序列和参考声音样本可能包括R声的基本训练。
现在参看图3,它是图2中的学生样本记分器160的一个优选实现的一个简化框图。
如上所述,作为输入记分单元160既可以直接从学生响应样本接收机130也可以间接地通过学生响应样本存储器150接收学生响应样本。响应的音量和持续时间最好由一个音量/持续时间校正器单元250用常规方法校正。如果采用这里描述的参数抽取的线性预测编码方法,那么音量校正就不是必需的,因为在参数抽取期间音量是与其它参数相分离的。
可以采用由Itakura所著的上述参考文献中所描述的时间卷积方法校正持续时间。
如果希望只分析一个响应样本的一部分,或者希望分别分析响应样本的多个部分,那么一个分段单元260将每一个响应样本进行分段。每一段或每一部分可以包括一个语音单元(例如一个音节或语音)。例如,辅音C和T可以从一个学生的单词CAT的发音中除去,以允许单独地分析语音A。此外,每一段或每一部分可以包括一个记时单元。如果短的话,采用固定长度的段,那么持续时间校正就不是必需的了。
为了对一个响应样本进行分段,首先把静音边界(silence-speech boundary)识别为能量增高几倍于背景声级并保持高的点。可以采用任何合适的技术识别静音边界,例如在由Rabiner和Sambur所著的上述参考文献中所描述的技术,其公开的内容在这里参考引用。
接着,通过识别能量保持高但在主音频率降低至大约100至200赫兹的点,而识别辅音/元音边界。主频率可以由一个过零记数器进行测量,可操作过零记数器记数波形穿过横轴的次数。
此外,可以绕过或省去样本分段单元260,并且每一个响应样本可以作为一个单一的单元整体地进行分析。
通过根据存储在图2中非特定人参数数据库170中的非特定人参数评价学生响应,可以操作参数比较单元280对学生响应进行记分。一个单个学生响应的分数最好代表由参数化单元270导出的单个学生响应的参数与存储在数据库170中的相应非特定人参数之间的相似度。
例如,系统可以将学生的响应样本与相应的多个存储参考样本进行比较,从而获得多个相似度数值,并且可以用这些相似度数值中的指示最大相似度的最高值作为学生响应的分数。
由参数比较单元280计算的学生响应分数最好提供给图1中的下列单元:
(a)显示器180,它用于显示给学生。可选择地,可以给学生提供一个指示分数的声音信息;
(b)学生跟踪数据库190,它用于存储;
(c)提示序列发生器200,以使提示序列发生器能适合于提示的连续顺序并使已录制的参考声音样本能适合于作为由分数表明的使用者的进展。
现在参看图4描述系统建立期间用于存储在参考声音样本库120中的预录制材料制备的一种优选方法。
如上所述,在系统建立期间,对要学习的每一个单词、语音或其它语音单元都要录制一个参考声音样本。在步骤300中,选择一组单词、语音、短语或其它声音样本。
最好,采用多个语音模型,以使之能代表多个性别、年龄和地方或民族的方言。例如,在一个设计用于英语发音教学系统中的多个语音模型可以包括以下六个语音模型:
男人-英国方言
女人-英国方言
儿童-英国方言
男人-美国方言
女人-美国方言
儿童-美国方言
在步骤310中,选择多个语音模型。由每一个语音模型产生在步骤300中选择的每一个声音样本。
在步骤320中,系统对每一个录制的声音样本进行录制、数字化并且存储在存储器中。
在步骤330中,对每一个录制的声音样本的幅度进行校正。
在步骤340中,最好将每一个录制的声音样本划分成时间段或语音段。
在步骤350中,通过从中抽取至少一个参数而将每一个录制的声音样本特征化。
现在参看照图5A-5B的流程图描述使用图1-3系统的一个典型使用者对话。
在步骤400中,给使用者提供一个语言菜单并提示他指定其本国语。此外,可以提示使用者用其本国语说一些单词,并且系统可以分析所说的单词并识别其本国语。
在步骤405中,给使用者提供一个语音模型菜单,其选择对应于上述的多个语音模型,并且菜单提示使用者选择最适合他的语音模型。
在步骤410中,提示使用者选择一个初始参考声音样本(例如一个语音、单词或短语)以用于练习。此外,用于练习的样本可以由系统选择,最好部分地根据在步骤400中使用者指定的其本国语。
步骤420-给使用者播放参考声音样本,并且可选择地,其波形同时显示给使用者。
步骤430-使用者尝试着对参考声音样本的重发由系统接收、数字化并存储在存储器中。
步骤450-系统对声音电平和重发声音样本的持续时间进行校正。
步骤460-可选择地,重放重发声音样本并将重发声音样本的校正波形显示给使用者。
步骤490-系统通过样本的参数化从重发声音样本中抽取声音特征(例如线性预测系数)。合适的声音特征抽取方法在由Itakura听著的上述参考文献以及其中所引用的参考文献中进行了描述,其公开的内容在这里参考引用。
步骤500-系统将步骤490中抽取的参数与参考声音样本的存储特征进行比较并计算相似度分数。
步骤510-系统显示相似度分数。
步骤520-系统最好重放参考和重发样本,以供使用者进行声音比较。
步骤530-可选择地,系统存储相似度分数和/或重发样本本身,以用于随后的跟踪。
步骤540-除非系统或学生决定对话终止,否则系统返回步骤410。参考样本的系统选择最好考虑学生的表现。例如,如果对于一个特定的参考声音样本的相似度的分数低(表明学生的表现差),那么可以重复参考声音样本直到获得一个最低线为止。接着,可以采用一个相似的参考声音样本以确保获得的表现水平推广到相似的语音任务。
例如,如果使用者在重发CAT中的A时有困难,那么可以重复地出现样本CAT并且可以跟随着包括A的其它样本(例如BAD)。
图6-11是多个语音模型和学生产生的语音样本的波形曲线图。
图6表示一个语音模型重发单词“CAT”0.5秒的情形。因不是从图6所示的单词“CAT”的语音模型的重发中除去辅音获得一个语音模型重发元音“A”0.128秒的曲线图。如上所述,通过寻找“CAT”中的辅音元音边界,识别元音“A”的起点。根据本发明的实施例,每一个元音的持续时间预定的。已经发现0.128秒的预定元音持续时间能提供满意的结果,然而这个数值并不打算是限制性的。
根据本发明的另一个实施例,每一个元音的持续时间不是预定的。取尔代之的是,通过对语音样本的合适的分析,识别元音/辅音边界。
图8是一个学生尝试着重发单词“CAT”0.5秒的曲线图。
图9是从图8所示的单词“CAT”的语音模型的重发中除去辅音获得的一个语音模型重发元音“A”0.128秒的曲线图。
图10是一个学生尝试着重发单词“CAT”0.35秒的曲线图。图11是从图9所示的单词“CAT”的语音模型的重发中除去辅音获得的一个语音模型重发元音“A”0.128秒的曲线图。
熟知本领域的技术人员应当理解的是:本发明并不限于以上所特别图示和描述的内容。相反地,本发明的范围只由随后的权利要求书所限定。

Claims (27)

1、交互式语音训练装置,它包括:
一个声音样本发生器,它用于给使用者播放预录制的参考声音样本,从而使用者尝试着重发;
一个声音样本记分器,它用于对使用者的重发声音样本进行记分。
2、根据权利要求1所述的装置,其特征在于,所述声音样本记分器包括:
一个参考/响应比较单元,它用于将使用者的重发声音样本的至少一个特征与所述声音样本的至少一个特征进行比较;
一个相似度指示器,它用于提供一个至少一个重发声音样本的特征与至少一个参考声音样本的特征之间的相似度的输出指示。
3、根据权利要求2所述的装置,其特征在于,还包括一个使用者响应存储器,它用于存储参考声音样本的使用者的重发,所述参考/响应比较单元可以利用该使用者响应存储器。
4、根据权利要求2所述的装置,其特征在于,所述参考/响应比较单元包括一个音量/持续时间校正器,它用于将参考和重发声音样本的音量和持续时间校正。
5、根据权利要求2所述的装置,其特征在于,所述参考/响应比较单元包括一个参数化单元,它用于从所述参考和重发声音样本中抽取声音信号参数。
6、根据权利要求5所述的装置,其特征在于,所述参考/响应比较单元还包括用于将所述声音样本参数与所述重发声音样本参数进行比较的装置。
7、根据权利要求6所述的装置,其特征在于,所述用于比较的装置包括一个参数分数发生器,它提供一个表示所述参考与重发声音样本的声音信号参数之间的相似度的分数。
8、根据权利要求7所述的装置,其特征在于,所述输出指示包括所述分数的显示。
9、根据权利要求2所述的装置,其特征在于,所述输出指示包括至少一个声音波形的显示。
10、根据权利要求1所述的装置,其特征在于,还包括一个提示序列发生器,它给使用者产生提示序列。
11、根据权利要求1所述的交互式语音训练装置,其特征在于,还包括一个参考声音样本库,其中存储着参考声音样本,并且所述声音样本发生器可以利用该参考声音样本库。
12、根据权利要求11所述的装置,其特征在于,所述参考声音样本库包括由多个语音模型产生的声音样本的大量录音。
13、根据权利要求12所述的装置,其特征在于,所述多个语音模型以下特征中的至少一项中是相互不同的:
性别;
年龄;
方言。
14、交互式语音训练装置,它包括:
一个提示序列发生器,它给使用者产生提示序列并提示使用者产生相应的声音样本序列,
一个参考/响应比较单元,它将该使用者产生的每一个声音样本的至少一个特征与一个参考进行比较。
15、根据权利要求14所述装置,其特征在于,所述与单个使用者产生的声音样本比较的参考包括一个相应的存储的参考声音样本。
16、根据权利要求14所述的装置,其特征在于,所述提示序列根据使用者的表现转移。
17、根据权利要求14所述的装置,其特征在于,所述提示序列至少部分地由使用者指定的本国语确定。
18、根据权利要求14所述的装置,其特征在于,所述提示序列发生器包括一个多语言提示序列库,其中存储着以多种语言表示的多个提示序列,并且该提示序列发生器根据使用者指定的基本国语的单一语言操作产生多种语言中的一种单一语言的提示序列。
19、交互式语音训练装置,它包括:
一个声音样本录音机,它录制使用者产生的声音样本;
一个参考/响应比较单元,它将使用者产生的声音样本的至少一个特征与一个参考进行比较,该比较单元包括:
一个声音样本分段器,它将使用者产生的声音样本分段成多个段;
一个段比较单元,它将多个段中的至少一个中的至少一个特征与一个参考进行比较。
20、根据权利要求19所述的装置,其特征在于,所述声音样本分段器包括一个语音分段器,它将使用者产生的声音样本分段成多个语音段。
21、根据权利要求20所述的装置,其特征在于,至少一个所述语音段包括一个语音。
22、根据权利要求20所述的装置,其特征在于,至少一个所述语音段包括一个音节。
23、根据权利要求21所述的装置,其特征在于,所述语音包括一个元音。
24、根据权利要求21所述的装置,其特征在于,所述语音包括一个辅音。
25、交互式语音训练装置,它包括:
一个声音样本录音机,它录制由使用者产生的声音样本;
一个非特定人声音样本记分器,它基于至少一个非特定人参数对使用者产生的声音样本进行记分。
26、根据权利要求25所述的装置,其特征在于,所述至少一个非特定人参数包括一个用于一个预定频率上的能量数值的阀值。
27、根据权利要求1所述的装置,其特征在于,还包括一个常规个人计算机。
CN94102645A 1993-01-21 1994-01-20 语音教学计算机化系统 Pending CN1101446A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/007,242 US5487671A (en) 1993-01-21 1993-01-21 Computerized system for teaching speech
US08/007,242 1993-01-21

Publications (1)

Publication Number Publication Date
CN1101446A true CN1101446A (zh) 1995-04-12

Family

ID=21725036

Family Applications (1)

Application Number Title Priority Date Filing Date
CN94102645A Pending CN1101446A (zh) 1993-01-21 1994-01-20 语音教学计算机化系统

Country Status (6)

Country Link
US (2) US5487671A (zh)
KR (1) KR940018741A (zh)
CN (1) CN1101446A (zh)
AU (1) AU6093994A (zh)
TW (1) TW277120B (zh)
WO (1) WO1994017508A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1045854C (zh) * 1995-06-16 1999-10-20 曹敏娟 红外双向语音传输系统
CN101510423B (zh) * 2009-03-31 2011-06-15 北京志诚卓盛科技发展有限公司 一种分层次、交互式发音质量评估与诊断系统
CN102460346A (zh) * 2009-06-10 2012-05-16 微软公司 触摸任何地方来讲话
CN101903940B (zh) * 2008-01-24 2014-08-27 高通股份有限公司 用于改进音频播放器之间的输出音量的相似度的系统和方法
CN104505103A (zh) * 2014-12-04 2015-04-08 上海流利说信息技术有限公司 语音质量评价设备、方法和系统
CN106156905A (zh) * 2015-03-25 2016-11-23 肖圣林 移动互联学习平台
CN109637543A (zh) * 2018-12-12 2019-04-16 平安科技(深圳)有限公司 语音卡的语音数据处理方法和装置
CN109872727A (zh) * 2014-12-04 2019-06-11 上海流利说信息技术有限公司 语音质量评价设备、方法和系统

Families Citing this family (125)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE1007899A3 (nl) * 1993-12-22 1995-11-14 Philips Electronics Nv Informatiesysteem met middelen voor gebruikerinterakties, een informatiebehandelings- en informatiebeheersysteem en middelen voor het onder besturing van genoemd systeem vormen van responses aan de gebruiker.
US5540589A (en) * 1994-04-11 1996-07-30 Mitsubishi Electric Information Technology Center Audio interactive tutor
US6283760B1 (en) 1994-10-21 2001-09-04 Carl Wakamoto Learning and entertainment device, method and system and storage media therefor
CA2206860A1 (en) * 1994-12-08 1996-06-13 Michael Mathias Merzenich Method and device for enhancing the recognition of speech among speech-impaired individuals
FR2730579B1 (fr) * 1995-02-10 1997-05-09 2B Technology Sarl Appareil portatif destine a l'exercice de diction de stimuli vocaux
GB2298514A (en) * 1995-03-03 1996-09-04 Ghazala Shaheen Jamil Malik Learning the Quran Karim
US5717828A (en) * 1995-03-15 1998-02-10 Syracuse Language Systems Speech recognition apparatus and method for learning
US6109923A (en) 1995-05-24 2000-08-29 Syracuase Language Systems Method and apparatus for teaching prosodic features of speech
PT956552E (pt) * 1995-12-04 2002-10-31 Jared C Bernstein Metodo e dispositivo para informacao combinada de sinais de voz para interaccao adaptavel ao ensino e avaliacao
JPH09231225A (ja) * 1996-02-26 1997-09-05 Fuji Xerox Co Ltd 言語情報処理装置
US5893720A (en) * 1996-03-25 1999-04-13 Cohen; Hannah R. Development language system for infants
US5766015A (en) * 1996-07-11 1998-06-16 Digispeech (Israel) Ltd. Apparatus for interactive language training
US5832441A (en) * 1996-09-16 1998-11-03 International Business Machines Corporation Creating speech models
WO1998014934A1 (en) * 1996-10-02 1998-04-09 Sri International Method and system for automatic text-independent grading of pronunciation for language instruction
US5915001A (en) 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
US6157913A (en) * 1996-11-25 2000-12-05 Bernstein; Jared C. Method and apparatus for estimating fitness to perform tasks based on linguistic and other aspects of spoken responses in constrained interactions
SE506656C2 (sv) * 1996-12-27 1998-01-26 Ewa Braun Anordning för fonologisk träning med grafisk återgivning av ljud och talorgan
US6151577A (en) * 1996-12-27 2000-11-21 Ewa Braun Device for phonological training
US5857173A (en) * 1997-01-30 1999-01-05 Motorola, Inc. Pronunciation measurement device and method
US5811791A (en) * 1997-03-25 1998-09-22 Sony Corporation Method and apparatus for providing a vehicle entertainment control system having an override control switch
US6109107A (en) 1997-05-07 2000-08-29 Scientific Learning Corporation Method and apparatus for diagnosing and remediating language-based learning impairments
US5920838A (en) * 1997-06-02 1999-07-06 Carnegie Mellon University Reading and pronunciation tutor
AU8995798A (en) * 1997-09-05 1999-03-29 Idioma Ltd. Interactive system for teaching speech pronunciation and reading
US6603835B2 (en) 1997-09-08 2003-08-05 Ultratec, Inc. System for text assisted telephony
US6019607A (en) * 1997-12-17 2000-02-01 Jenkins; William M. Method and apparatus for training of sensory and perceptual systems in LLI systems
US6159014A (en) * 1997-12-17 2000-12-12 Scientific Learning Corp. Method and apparatus for training of cognitive and memory systems in humans
US5927988A (en) * 1997-12-17 1999-07-27 Jenkins; William M. Method and apparatus for training of sensory and perceptual systems in LLI subjects
US6134529A (en) * 1998-02-09 2000-10-17 Syracuse Language Systems, Inc. Speech recognition apparatus and method for learning
US7203649B1 (en) * 1998-04-15 2007-04-10 Unisys Corporation Aphasia therapy system
US6305942B1 (en) 1998-11-12 2001-10-23 Metalearning Systems, Inc. Method and apparatus for increased language fluency through interactive comprehension, recognition and generation of sounds, words and sentences
WO2000057386A1 (en) * 1999-03-25 2000-09-28 Planetlingo, Inc. Method and system for computer assisted natural language instruction with adjustable speech recognizer
US6224383B1 (en) 1999-03-25 2001-05-01 Planetlingo, Inc. Method and system for computer assisted natural language instruction with distracters
US6397185B1 (en) * 1999-03-29 2002-05-28 Betteraccent, Llc Language independent suprasegmental pronunciation tutoring system and methods
US6296489B1 (en) * 1999-06-23 2001-10-02 Heuristix System for sound file recording, analysis, and archiving via the internet for language training and other applications
US6468084B1 (en) * 1999-08-13 2002-10-22 Beacon Literacy, Llc System and method for literacy development
US7149690B2 (en) * 1999-09-09 2006-12-12 Lucent Technologies Inc. Method and apparatus for interactive language instruction
US6434518B1 (en) * 1999-09-23 2002-08-13 Charles A. Glenn Language translator
WO2001024139A1 (fr) * 1999-09-27 2001-04-05 Kojima Co., Ltd. Systeme d'evaluation de la prononciation
US7330815B1 (en) 1999-10-04 2008-02-12 Globalenglish Corporation Method and system for network-based speech recognition
US6496692B1 (en) 1999-12-06 2002-12-17 Michael E. Shanahan Methods and apparatuses for programming user-defined information into electronic devices
US8170538B2 (en) 1999-12-06 2012-05-01 Solocron Media, Llc Methods and apparatuses for programming user-defined information into electronic devices
US7149509B2 (en) * 1999-12-06 2006-12-12 Twenty Year Innovations, Inc. Methods and apparatuses for programming user-defined information into electronic devices
JP3520022B2 (ja) * 2000-01-14 2004-04-19 株式会社国際電気通信基礎技術研究所 外国語学習装置、外国語学習方法および媒体
US6847931B2 (en) 2002-01-29 2005-01-25 Lessac Technology, Inc. Expressive parsing in computerized conversion of text to speech
US6963841B2 (en) * 2000-04-21 2005-11-08 Lessac Technology, Inc. Speech training method with alternative proper pronunciation database
WO2001082291A1 (en) * 2000-04-21 2001-11-01 Lessac Systems, Inc. Speech recognition and training methods and systems
US7280964B2 (en) * 2000-04-21 2007-10-09 Lessac Technologies, Inc. Method of recognizing spoken language with recognition of language color
US6865533B2 (en) * 2000-04-21 2005-03-08 Lessac Technology Inc. Text to speech
US6850882B1 (en) 2000-10-23 2005-02-01 Martin Rothenberg System for measuring velar function during speech
JP2004526473A (ja) * 2000-11-15 2004-09-02 ロゴメトリックス・コーポレーション 口の動作及び関連した事象を利用する方法
US7203840B2 (en) * 2000-12-18 2007-04-10 Burlingtonspeech Limited Access control for interactive learning system
US7996321B2 (en) * 2000-12-18 2011-08-09 Burlington English Ltd. Method and apparatus for access control to language learning system
WO2002050798A2 (en) * 2000-12-18 2002-06-27 Digispeech Marketing Ltd. Spoken language teaching system based on language unit segmentation
US6732076B2 (en) 2001-01-25 2004-05-04 Harcourt Assessment, Inc. Speech analysis and therapy system and method
US6711544B2 (en) 2001-01-25 2004-03-23 Harcourt Assessment, Inc. Speech therapy system and method
WO2002059856A2 (en) * 2001-01-25 2002-08-01 The Psychological Corporation Speech transcription, therapy, and analysis system and method
US6725198B2 (en) 2001-01-25 2004-04-20 Harcourt Assessment, Inc. Speech analysis system and method
US6523007B2 (en) * 2001-01-31 2003-02-18 Headsprout, Inc. Teaching method and system
US6882707B2 (en) * 2001-02-21 2005-04-19 Ultratec, Inc. Method and apparatus for training a call assistant for relay re-voicing
US20020010715A1 (en) * 2001-07-26 2002-01-24 Garry Chinn System and method for browsing using a limited display device
US7881441B2 (en) * 2005-06-29 2011-02-01 Ultratec, Inc. Device independent text captioned telephone service
US8416925B2 (en) 2005-06-29 2013-04-09 Ultratec, Inc. Device independent text captioned telephone service
KR20030078493A (ko) * 2002-03-29 2003-10-08 박성기 외국어 학습장치
US20030235806A1 (en) * 2002-06-19 2003-12-25 Wen Say Ling Conversation practice system with dynamically adjustable play speed and the method thereof
US7219059B2 (en) * 2002-07-03 2007-05-15 Lucent Technologies Inc. Automatic pronunciation scoring for language learning
US7752045B2 (en) * 2002-10-07 2010-07-06 Carnegie Mellon University Systems and methods for comparing speech elements
WO2004049283A1 (en) * 2002-11-27 2004-06-10 Visual Pronunciation Software Limited A method, system and software for teaching pronunciation
US20040148226A1 (en) * 2003-01-28 2004-07-29 Shanahan Michael E. Method and apparatus for electronic product information and business transactions
US7524191B2 (en) * 2003-09-02 2009-04-28 Rosetta Stone Ltd. System and method for language instruction
US7113981B2 (en) * 2003-12-29 2006-09-26 Mixxer, Inc. Cellular telephone download locker
US20050142522A1 (en) * 2003-12-31 2005-06-30 Kullok Jose R. System for treating disabilities such as dyslexia by enhancing holistic speech perception
US20050153267A1 (en) * 2004-01-13 2005-07-14 Neuroscience Solutions Corporation Rewards method and apparatus for improved neurological training
US20050175972A1 (en) * 2004-01-13 2005-08-11 Neuroscience Solutions Corporation Method for enhancing memory and cognition in aging adults
WO2005081511A1 (en) * 2004-02-18 2005-09-01 Ultratec, Inc. Captioned telephone service
US8515024B2 (en) 2010-01-13 2013-08-20 Ultratec, Inc. Captioned telephone service
EP1721302A1 (en) * 2004-03-02 2006-11-15 AUBERT, Christian Method for teaching verbs of foreign language
NZ534092A (en) * 2004-07-12 2007-03-30 Kings College Trustees Computer generated interactive environment with characters for learning a language
US20060057545A1 (en) * 2004-09-14 2006-03-16 Sensory, Incorporated Pronunciation training method and apparatus
US7258660B1 (en) 2004-09-17 2007-08-21 Sarfati Roy J Speech therapy method
US20060084047A1 (en) * 2004-10-20 2006-04-20 Inventec Corporation System and method of segmented language learning
WO2006076280A2 (en) * 2005-01-11 2006-07-20 Educational Testing Service Method and system for assessing pronunciation difficulties of non-native speakers
US11258900B2 (en) 2005-06-29 2022-02-22 Ultratec, Inc. Device independent text captioned telephone service
JP5318572B2 (ja) * 2005-07-15 2013-10-16 モエ,リチャード,エイ 音声発音教育装置並びに音声発音教育方法および音声発音教育プログラム
WO2007016509A1 (en) * 2005-08-01 2007-02-08 Kazuaki Uekawa A system of sound representation and pronunciation techniques for english and other european languages
US7657221B2 (en) * 2005-09-12 2010-02-02 Northwest Educational Software, Inc. Virtual oral recitation examination apparatus, system and method
TWI277947B (en) * 2005-09-14 2007-04-01 Delta Electronics Inc Interactive speech correcting method
US20090220926A1 (en) * 2005-09-20 2009-09-03 Gadi Rechlis System and Method for Correcting Speech
JP2007140200A (ja) * 2005-11-18 2007-06-07 Yamaha Corp 語学学習装置およびプログラム
DE602007002906D1 (de) * 2006-05-22 2009-12-03 Philips Intellectual Property System und verfahren zum trainieren eines dysarthrischen sprechers
WO2008083689A1 (en) * 2007-01-14 2008-07-17 The Engineering Company For The Development Of Computer Systems ; (Rdi) System and method for qur'an recitation rules
TW200838035A (en) 2007-03-08 2008-09-16 Cirocomm Technology Corp Improved miniature digital antenna with multi-bandwidth switch
US7659856B2 (en) 2007-05-09 2010-02-09 Cirocomm Technology Corp. Extremely miniaturized digital antenna having switchable multiple bandwidths
WO2009006433A1 (en) * 2007-06-29 2009-01-08 Alelo, Inc. Interactive language pronunciation teaching
JP2009128675A (ja) * 2007-11-26 2009-06-11 Toshiba Corp 音声を認識する装置、方法およびプログラム
JP5221317B2 (ja) 2007-12-19 2013-06-26 ツィンファ ユニバーシティ 電界放出型電子源
GB2458461A (en) * 2008-03-17 2009-09-23 Kai Yu Spoken language learning system
US8983832B2 (en) * 2008-07-03 2015-03-17 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
KR20100022243A (ko) * 2008-08-19 2010-03-02 현대자동차주식회사 블루투스를 이용한 외국어 학습 시스템 및 그 방법
US20100105015A1 (en) * 2008-10-23 2010-04-29 Judy Ravin System and method for facilitating the decoding or deciphering of foreign accents
GB0920480D0 (en) * 2009-11-24 2010-01-06 Yu Kai Speech processing and learning
TWI431563B (zh) * 2010-08-03 2014-03-21 Ind Tech Res Inst 語言學習系統、語言學習方法及其程式產品
US9691289B2 (en) * 2010-12-22 2017-06-27 Brightstar Learning Monotonous game-like task to promote effortless automatic recognition of sight words
US8744856B1 (en) 2011-02-22 2014-06-03 Carnegie Speech Company Computer implemented system and method and computer program product for evaluating pronunciation of phonemes in a language
EP2847749A1 (en) * 2012-05-09 2015-03-18 Koninklijke Philips N.V. Device and method for supporting a behavior change of a person
WO2014002391A1 (ja) * 2012-06-29 2014-01-03 テルモ株式会社 情報処理装置および情報処理方法
TWI508033B (zh) * 2013-04-26 2015-11-11 Wistron Corp 語言學習方法與裝置以及電腦可讀記錄媒體
JP6244658B2 (ja) * 2013-05-23 2017-12-13 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム
US20150031003A1 (en) * 2013-07-24 2015-01-29 Aspen Performance Technologies Neuroperformance
US10389876B2 (en) 2014-02-28 2019-08-20 Ultratec, Inc. Semiautomated relay method and apparatus
US20180034961A1 (en) 2014-02-28 2018-02-01 Ultratec, Inc. Semiautomated Relay Method and Apparatus
US20180270350A1 (en) 2014-02-28 2018-09-20 Ultratec, Inc. Semiautomated relay method and apparatus
US10878721B2 (en) 2014-02-28 2020-12-29 Ultratec, Inc. Semiautomated relay method and apparatus
US10748523B2 (en) 2014-02-28 2020-08-18 Ultratec, Inc. Semiautomated relay method and apparatus
JP2016045420A (ja) * 2014-08-25 2016-04-04 カシオ計算機株式会社 発音学習支援装置およびプログラム
JP2017142353A (ja) * 2016-02-10 2017-08-17 株式会社World Talk Box 言語学習装置、言語学習方法、言語学習プログラム
US20180197438A1 (en) * 2017-01-10 2018-07-12 International Business Machines Corporation System for enhancing speech performance via pattern detection and learning
CN109697906B (zh) * 2017-10-20 2020-12-04 深圳市鹰硕技术有限公司 一种基于互联网教学平台的跟随教学方法
US10916154B2 (en) 2017-10-25 2021-02-09 International Business Machines Corporation Language learning and speech enhancement through natural language processing
CN109801194B (zh) * 2017-11-17 2023-06-23 深圳市鹰硕技术有限公司 一种具有远程评价功能的跟随教学方法
US11210968B2 (en) * 2018-09-18 2021-12-28 International Business Machines Corporation Behavior-based interactive educational sessions
JP7195593B2 (ja) * 2018-12-13 2022-12-26 株式会社Ecc 語学学習用装置および語学学習用プログラム
US11282402B2 (en) * 2019-03-20 2022-03-22 Edana Croyle Speech development assembly
US11288974B2 (en) * 2019-03-20 2022-03-29 Edana Croyle Speech development system
CN109979433A (zh) * 2019-04-02 2019-07-05 北京儒博科技有限公司 语音跟读处理方法、装置、设备和存储介质
US11539900B2 (en) 2020-02-21 2022-12-27 Ultratec, Inc. Caption modification and augmentation systems and methods for use by hearing assisted user

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4507750A (en) 1982-05-13 1985-03-26 Texas Instruments Incorporated Electronic apparatus from a host language
EP0094502A1 (en) 1982-05-13 1983-11-23 Texas Instruments Incorporated Electronic learning aid for assistance in speech pronunciation
US4641343A (en) * 1983-02-22 1987-02-03 Iowa State University Research Foundation, Inc. Real time speech formant analyzer and display
FR2546323B1 (fr) * 1983-05-20 1985-08-30 Tomatis Alfred Appareil d'entrainement a la pratique d'une langue maternelle ou etrangere, en vue de son assimilation integrale
GB8817705D0 (en) 1988-07-25 1988-09-01 British Telecomm Optical communications system
WO1990001202A1 (en) 1988-07-28 1990-02-08 John Harold Dunlavy Improvements to aircraft collision avoidance
FR2674660A1 (fr) * 1989-06-26 1992-10-02 Bozadjian Edouard Systeme d'evaluation comparative pour l'amelioration de la prononciation.

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1045854C (zh) * 1995-06-16 1999-10-20 曹敏娟 红外双向语音传输系统
CN101903940B (zh) * 2008-01-24 2014-08-27 高通股份有限公司 用于改进音频播放器之间的输出音量的相似度的系统和方法
CN101510423B (zh) * 2009-03-31 2011-06-15 北京志诚卓盛科技发展有限公司 一种分层次、交互式发音质量评估与诊断系统
CN102460346A (zh) * 2009-06-10 2012-05-16 微软公司 触摸任何地方来讲话
CN104505103A (zh) * 2014-12-04 2015-04-08 上海流利说信息技术有限公司 语音质量评价设备、方法和系统
CN109872727A (zh) * 2014-12-04 2019-06-11 上海流利说信息技术有限公司 语音质量评价设备、方法和系统
CN106156905A (zh) * 2015-03-25 2016-11-23 肖圣林 移动互联学习平台
CN109637543A (zh) * 2018-12-12 2019-04-16 平安科技(深圳)有限公司 语音卡的语音数据处理方法和装置

Also Published As

Publication number Publication date
USRE37684E1 (en) 2002-04-30
US5487671A (en) 1996-01-30
KR940018741A (ko) 1994-08-18
TW277120B (zh) 1996-06-01
AU6093994A (en) 1994-08-15
WO1994017508A1 (en) 1994-08-04

Similar Documents

Publication Publication Date Title
CN1101446A (zh) 语音教学计算机化系统
US5717828A (en) Speech recognition apparatus and method for learning
US6134529A (en) Speech recognition apparatus and method for learning
CN1202512C (zh) 用于识别连续和分立语音的语音识别系统
JP3520022B2 (ja) 外国語学習装置、外国語学習方法および媒体
US8280733B2 (en) Automatic speech recognition learning using categorization and selective incorporation of user-initiated corrections
US7299188B2 (en) Method and apparatus for providing an interactive language tutor
CN1128435C (zh) 用于无读本的和无显示装置的语音识别注册方法
CN1152365C (zh) 音调跟踪装置和方法
CN110148427A (zh) 音频处理方法、装置、系统、存储介质、终端及服务器
CN1462366A (zh) 说话人声音的后台学习
CN1320902A (zh) 语音识别装置、语音识别方法和记录介质
CN1763843A (zh) 用于语言学习机的发音质量评价方法
CN1703734A (zh) 从声音确定音符的方法和装置
JP2006048065A (ja) 音声対話式言語指導法及び装置
CN1645476A (zh) 使用切换状态空间模型的多模变分推导的语音识别方法
CN1521729A (zh) 使用隐轨迹和隐马尔可夫模型进行语音识别的方法
CN1534597A (zh) 利用具有转换状态空间模型的变化推理的语音识别方法
CN111951825A (zh) 一种发音测评方法、介质、装置和计算设备
CN1841496A (zh) 测量语速的方法和装置以及录音设备
CN111653265A (zh) 语音合成方法、装置、存储介质和电子设备
KR100995847B1 (ko) 인터넷상에서의 소리분석 기반 어학 학습방법 및 시스템
CN111653266B (zh) 语音合成方法、装置、存储介质和电子设备
Neumeyer et al. Webgrader: a multilingual pronunciation practice tool
US20060084047A1 (en) System and method of segmented language learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication