CN1953055B - 会话控制器 - Google Patents

会话控制器 Download PDF

Info

Publication number
CN1953055B
CN1953055B CN2006101357929A CN200610135792A CN1953055B CN 1953055 B CN1953055 B CN 1953055B CN 2006101357929 A CN2006101357929 A CN 2006101357929A CN 200610135792 A CN200610135792 A CN 200610135792A CN 1953055 B CN1953055 B CN 1953055B
Authority
CN
China
Prior art keywords
plan
statement
information
answer
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2006101357929A
Other languages
English (en)
Other versions
CN1953055A (zh
Inventor
黄声扬
胜仓裕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universal Entertainment Corp
Original Assignee
Universal Entertainment Corp
P to PA Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universal Entertainment Corp, P to PA Inc filed Critical Universal Entertainment Corp
Publication of CN1953055A publication Critical patent/CN1953055A/zh
Application granted granted Critical
Publication of CN1953055B publication Critical patent/CN1953055B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Abstract

一种会话控制器根据用户话语输出答复语句。所述会话控制器包括会话数据库和会话控制单元。所述会话数据库存储多个计划。各个计划具有答复语句和一条或多条用于指定在所述答复语句之后将要被输出的下一候选答复语句的下一计划指定信息。所述会话控制单元根据用户话语选择存储在所述会话数据库中的一个计划并输出所选择计划具有的答复语句。然后,所述会话控制单元根据下一用户话语选择所述计划具有的一条下一计划指定信息并基于所选择的那条输出下一计划指定信息输出下一候选答复语句。一部分计划具有一系列问题作为所述答复语句。

Description

会话控制器
技术领域
本发明涉及一种输出对用户的话语的回答或答复的会话控制器。
背景技术
近来,从节约成本和加速定购过程的角度来讲,提出在饭店使用终端装置代替人处理消费者的订单。在日本专利公开号第H7-282134和2004-145606中公开了传统的终端装置。可以通过使用这些终端装置处理来自消费者在任何时候的定单。
但是,不一定通过引入这些终端装置来增加用户服务。在一个人获得消费者的定单的情况下,消费者在与这个人通话时会给出想要的定单。另一方面,在终端装置获取消费者的订单的情况下,消费者从显示在终端装置上的各菜单中选择一个或多个菜单以告诉终端装置其想要的订单。在这种情况下,消费者不能选择除了终端装置上显示的菜单之外的其它的菜单。
发明内容
本发明的目的是提供一种会话控制器,其通过对用户重复一个问题而允许用户获得以前准备在其中的想要的信息。
本发明的另一目的是提供一种会话控制器,其能够处理允许用户获取以前准备在其中的想要的信息的会话、和包括除了包含在上述会话中的主题之外的其它主题的其它会话。
为了达到所述目的,本发明提供一种用于根据用户话语输出答复语句的会话控制器,其包括:会话数据库,用于存储多个计划,其中每个计划具有答复语句和一条或多条下一候选指定信息,其中所述一条或多条下一候选指定信息用于在答复语句后指定将要被输出的下一候选答复语句;以及计划会话单元,用于根据第一用户话语选择存储在所述会话数据库中的一个计划且输出所选择的计划具有的答复语句,以及根据第二用户话语选择所述计划具有的一条下一候选答复信息且基于所选择的那条下一候选答复信息输出下一候选答复语句;其中,一部分计划具有用于引导用户获取想要的信息的一系列问题作为所述答复语句。
下面的语句“用于引导用户获取想要的信息的一系列问题”是指与以前准备在所述会话控制器中的一条或多条信息相关的多个问题。更具体地,“用于引导用户获取想要的信息的一系列问题”是促进用户答复、选择或确定使得用户取得想要的信息的诸如语句、文本或单词之类的任何问题。
根据本发明,所述会话控制器可以通过向用户重复一问题而输出适合于用户或者用户所必需的信息,使得用户可以获取以前准备于所述会话控制器中的想要的信息。
在本发明的优选实施例中,所述计划会话单元在接收与所述下一候选答复语句无关的所述第二用户话语或不清楚所述第二用户话语与所述下一候选答复语句之间是否存在关系时,抑制所述下一候选答复语句的输出,然后在接收与所抑制的下一候选答复语句相关的第三用户话语时输出所抑制的下一候选答复语句。
根据所述实施例,当用户的兴趣转移到除了一系列问题之外的另外事情时,所述会话控制器可以抑制所述系列问题的输出。相对比,当用户的兴趣回到所述系列问题时,所述会话控制器可以重新开始从所述系列问题的抑制部分输出所述系列问题。
在本发明的优选实施例中,所述会话控制器,还包括交谈空间会话单元,其用于根据第二用户话语输出关于与所抑制的下一候选答复语句无关的主题的答复语句。
根据所述实施例,当用户想要谈论除了一系列问题之外的另一主题时,所述会话控制器可以抑制所述系列问题的输出,并且根据关于所述另一主题的用户话语,对用户作出反应。然后,当用户的兴趣返回到所述系列问题时,所述会话控制器可以重新开始从所述系列问题的抑制部分输出所述系列问题。因此,所述会话控制器可以通过向用户重复一问题而完成适合于用户或者用户所必需的信息的输出,使得用户可以获取以前准备于所述会话控制器中的想要的信息。即,所述会话控制器可以通过向用户重复一问题允许用户获取以前准备于所述会话控制器中的想要的信息,同时,在输出所述系列问题期间,根据用户话语插入关于除了所述系列问题之外的另一主题的会话。
在本发明的优选实施例中,所述会话控制器还包括:会话继续单元,其用于在没有输出所述关于与所保持的下一候选答复语句无关的主题的答复语句时,根据所述第二用户话语输出一答复语句以继续用户与会话控制器之间的会话。
根据所述实施例,当所述计划会话单元或交谈空间会话单元不能输出答复语句时,所述会话继续单元输出一答复语句以继续用户与会话控制器之间的会话。因此,所述会话控制器在用户话语的内容不清楚时可以抑制一系列问题的输出,并在用户的兴趣返回到所述系列问题时,重新开始从所述系列问题的抑制部分输出所述系列问题。
附图说明
图1是根据本发明第一实施例的会话控制器的框图;
图2是根据本发明第一实施例的语音识别单元的框图;
图3是根据本发明第一实施例的单词假定提炼部的处理时序图;
图4是根据本发明第一实施例的语音识别单元的操作的流程图;
图5是根据本发明第一实施例的会话控制器的部分放大框图;
图6是图示说明根据本发明第一实施例的字符串与从该字符串中所提取的语素之间的关系的示图;
图7是图示说明根据本发明第一实施例的语句类型、多个代表语句类型的字母表中的两个字母、话句的例子的示图。
图8是图示说明根据本发明第一实施例的存储在话语类型数据库中的字典的细节的示图;
图9是图示说明根据本发明第一实施例的在会话数据库中建立的层次结构的细节的示图;
图10是图示说明根据本发明第一实施例的在会话数据库中建立的层次结构中的主题识别信息的提炼的示图;
图11是图示说明根据本发明第一实施例的在会话数据库中形成的主题标题的内容的示图;
图12是图示说明根据本发明第一实施例的与在会话数据库中形成的主题标题相关联的答复语句的类型的示图;
图13是图示说明根据本发明第一实施例的与主题识别信息相关联的主题标题、答复语句和下一计划指派信息的内容的示图;
图14是图示说明根据本发明第一实施例的计划范围的示图;
图15是图示说明根据本发明第一实施例的计划转换的一个例子的示图;
图16是图示说明根据本发明第一实施例的计划转换的另一个例子的示图;
图17是图示说明根据本发明第一实施例的计划会话控制处理的细节的示图;
图18是根据本发明第一实施例的会话控制单元中的主处理的流程图;
图19是根据本发明第一实施例的部分计划会话控制处理的流程图;
图20是根据本发明第一实施例的其余计划会话控制处理的流程图;
图21是根据本发明第一实施例的基本控制状态的转换图;
图22是根据本发明第一实施例的交谈空间会话控制处理的流程图;
图23是根据本发明第二实施例的计划会话控制处理的细节的示图;
图24是根据本发明第二实施例的基本控制状态的转换图;
图25是根据本发明第二实施例的部分计划会话控制处理的流程图;
图26是根据本发明第二实施例的其余计划会话控制处理的流程图;
具体实施方式
下面将参照图1-26描述本发明的第一和第二实施方式。在所述实施方式中,本发明提出的会话控制器用于输出对用户话语的回答、和建立与用户的会话。
(A.第一实施方式)
(1.会话控制器的结构)
(1-1.总体结构)
根据第一实施方式的会话控制器1其中包括信息处理器,如,计算机或工作站,或对应于信息处理器的硬件。信息处理器具有中央处理单元(CPU)、主存储器(随机访问存储器:RAM)、只读存储器(ROM)、输入输出设备(I/O设备)、以及外部存储设备,例如硬盘。在ROM或外部存储设备中存储有用于使信息处理器用作会话控制器1的程序、以及用于使信息处理器执行会话控制方法的程序。所述CPU读取在主存储器上的程序并执行该程序,该程序实现会话控制器1或会话控制方法。注意的是,所述程序可以存储在计算机可读程序记录介质或外部设备中,所述计算机可读程序记录介质为例如磁盘、光盘、磁光盘、高密度盘(CD)或数字化视频光盘(DVD),所述外部设备为例如应用程序服务提供商(ASP)的服务器。在这种情况下,所述CPU从在主存储器上的计算机可读程序记录介质或外部设备读取并执行所述程序。
如图1所示,会话控制器1包括输入单元100、语音识别单元200、会话控制单元300、语句分析单元400、会话数据库500、输出单元600、和语音识别字典存储器700。
(1-1-1.输入单元)
输入单元100接收由用户所提供的输入信息(用户话语)。输入单元100将与所接收的话语内容对应的语音作为语音信号输出给语音识别单元200。注意的是,输入单元100可以是用于输入字符信息的键盘或触摸板。在这种情况下,省略语音识别单元200。
(1-1-2.语音识别单元)
语音识别单元200,基于话语的内容,识别与在输入单元100所接收到的话语内容对应的字符串。具体地,语音识别单元200在从输入单元100接收到语音信号时,基于所述的语音信号将所接收到的语音信号与会话数据库500及存储于语音识别字典存储器700中的字典进行比较。然后,语音识别单元200将基于所述语音信号所估计的语音识别结果输出到会话控制单元300。语音识别单元200向会话控制单元300请求获取会话数据库500的存储内容,然后接收会话控制单元300根据语音识别单元200的请求而查询到的会话数据库500的存储器内容。注意的是,语音识别单元200可以直接查询会话数据库500的存储器内容。
(1-1-2-1.语音识别单元的结构)
如图2所示,语音识别单元200包括特征提取部200A、缓冲存储器(BM)200B、单词查询部200C、缓冲存储器(BM)200D、候选确定部200E、和单词假定提炼部200F。单词查询部200C和单词假定提炼部200F连接到语音识别字典存储器700。候选确定部200E经会话控制单元300连接到会话数据库500。
语音识别字典存储器700其中存储音素隐马尔柯夫(markov)模型(音素HMM)。音素HMM具有各种状态,其中每种状态包括下面的信息:(a)状态号;(b)可接受的上下文类;(c)之前状态和随后状态的列表;(d)输出概率分布密度的参数;以及(e)自转换概率和到随后状态的转换概率。在所述实施例中,音素HMM是通过转变规定的扬声器混合HMM而产生的,以标识相应分布是由哪个扬声器得到的。输出概率分布功能具有包括34维对角协方差矩阵的混合高斯分布。语音识别字典存储器700其中进一步存储单词字典。在单词字典中存储有表示怎样读取音素HMM中的逐个单词的各符号串。
扬声器的语音在输入到麦克中之后输入到特征提取部200A,然后转变成语音信号。特征提取部200A在对所输入的语音信号执行A/D转换后从所述语音信号中提取特征参数,然后输出所述特征参数到缓冲存储器200B。我们可以提出用于提取特征参数的多种方法。例如,特征提取部200A执行LPC分析以提取34维特征参数,该34维特征参数包括对数幂、16维倒谱系数、Δ对数幂、以及16维Δ倒谱系数。衰变(aging)提取特征参数经缓冲存储器200B输入到单词查询部200C。
单词查询部200C,基于从特征提取部200A所输入的特征参数和存储在语音识别字典存储器700中的音素HMM和单词字典,通过使用单通道(one-pass)Viterbi解码方法查询单词假定,然后计算相似性。单词查询部200C计算一个单词的相似性和在每一刻音素HMM的每一状态从语音开始的相似性。更具体地,对每个相关联单词的标识号、相关联单词的语音发起时间、以及发出相关联单词之前所发出的之前的单词,计算相似性。单词查询部200C可以排除所计算的相似性中具有最低相似性的单词假定以减少计算吞吐量。单词查询部200C经缓冲存储器200D输出所查询到的单词假定、与所查询到的单词假定相关联的相似性、以及关于发出语音的时间之后经过的时间的信息(如,帧数量)到候选确定部200E和单词假定提炼部200F。
候选确定部200E参照会话控制单元300比较所查询到的单词假定和在规定交谈空间中的主题识别信息,然后确定在所查询到的单词假定中是否存在与主题识别信息一致的一个单词假定。如果有一单词假定,则候选确定部200E将该单词假定作为识别结果输出到会话控制单元300。如果没有这样的单词假定,则候选确定部200E要求单词假定提炼部200F对所查询的单词假定进行提炼。
下面将描述候选确定部200E的操作。我们假设下面的事情:(a)单词查询部200C输出多个单词假定(“KANTAKU(重申)”、“KATAKU(申辩)”、以及“KANTOKU(电影导演)”)以及分别与多个单词假定相关联的多种相似性(识别率)到候选确定部200E;(b)所述规定的交谈空间是关于电影的范围;(c)所述主题识别信息包括“KANTOKU(电影导演)”;(d)“KANTAKU(重申)”的相似性具有多种相似性中的最高值;以及(e)“KANTOKU(电影导演)”的相似性具有多种相似性中的最低值。
候选确定部200E将所查询到的单词假定与规定交谈空间的主题识别信息进行比较,然后确定一个单词假定“KANTOKU(电影导演)”与所述主题识别信息一致。候选确定部200E将该单词假定“KANTOKU(电影导演)”作为识别结果输出给会话控制单元300。由于这样的过程,与扬声器当前发出的主题“电影”相关联的单词假定“KANTOKU(电影导演)”相对于另外的单词假定“KANTAKU(重申)”和“KATAKU(申辩)”而被优先选择,其中单词假定“KANTAKU(重申)”和“KATAKU(申辩)”的相似性比“KANTOKU(电影导演)”的相似性具有更高的值。结果,候选确定部200E可以输出交谈上下文中的识别结果。
另一方面,如果没有所述单词假定,则候选确定部200E要求单词假定提炼部200F对所查询到的单词假定进行提炼。单词假定提炼部200F基于单词查询部200C经由缓冲存储器200D输出的查询到的单词假定,参考在语音识别字典存储器700中存储的统计语言模型,然后对所查询到的单词假定进行提炼,以便从对扬声器在不同语音发起时间开始发出的且在相同的语音终止时间结束发出的那些相同的单词的单词假定中选择一个单词假定。该单词假定在从不同的语音发起时间到相同的语音终止时间每相关联的相同单词的每一领头音素上下文所计算的相似性中具有最高的相似性。在所述实施方式中,我们定义表示三个音素串的领头音素上下文,所述三个音素串包括对在所述相关联的相同单词之前的单词的单词假定的末尾音素、以及对所述相关联的相同单词的单词假定的第一和第二音素。在所述提炼之后,单词假定提炼部200F将在所有提炼的单词假定的单词串中,将具有最高相似性的单词假定的一个单词串作为识别结果输出到会话控制单元300。
下面参照图3描述由单词假定提炼部200F所执行的单词提炼过程。
我们假设作为第(i-1)个的单词W(i-1)的单词假定有六个假定Wa、Wb、Wc、Wd、We、Wf,第i个的单词Wi包括音素串a1、a2、……an,其中第i个的单词Wi跟在第(i-1)个的单词W(i-1)之后。我们还假设前三个假定Wa、Wb、Wc和后三个假定Wd、We、Wf的末尾音素分别与末尾音素“x”、“y”相同。如果在相同的语音终止时间te有具有在前的三个假定Wa、Wb、Wc的三个假定和具有在前的三个假定Wd、We、Wf的一个假定,则单词假定提炼部200F从相互具有相同领头音素上下文的前三个假定中选择一个具有最高相似性的假定,然后排除另外两个假定。
在上面的例子中,单词假定提炼部200F并没有排除后面的一个假定,因为后面的一个假定的领头音素上下文不同于前三个假定的领头音素上下文,即,后面一个假定的在前假定的末尾音素“y”不同于前面三个假定的在前假定的末尾音素“x”。单词假定提炼部200F每隔一个在前假定的末尾音素留下一个假定。
我们可以定义领头音素上下文表示多个音素串,该多个音素串包括对于相关联的相同单词之前的单词的一个单词假定的末尾音素,对于相关联的相同单词之前的单词的单词假定的音素串(包括至少一个音素),对于相关联的相同单词的单词假定的音素串(包括第一音素)。
特征提取部200A、单词查询部200C、候选确定部200E、以及单词假定提炼部200F的每一个都包括诸如微型计算机之类的计算机。缓冲存储器200B、200D以及语音识别字典存储器700每一个都包括诸如硬盘之类的存储单元。
在所述实施例中,代替使用单词查询部200C和单词假定提炼部200F来实现语音识别,语音识别单元200可以包括被构造成参照音素HMM的音素比较部、和被构造成根据“单通道(One Pass)DP”算法通过参照统计语言模型来实现语音识别的语音识别部。
在上述实施例中,代替语音识别单元200,组成会话控制器1的一部分的会话数据库500和语音识别字典存储器700,这些元件可以形成独立于会话控制器1的语音识别装置。
(1-1-2-2.语音识别单元的操作)
语音识别单元200的操作将参照图4进行描述。
在步骤S401,当语音识别单元200从输入单元100接收语音信号时,其对包含在所接收的语音信号中的语音进行特征分析以产生特征参数。在步骤S402,语音识别单元200将所产生的特征参数与存储在语音识别字典存储器700中的音素HMM和语言模型进行比较,然后查询一定数量的单词假定并计算所述单词假定的相似性。在步骤S403,语音识别单元200将所查询的单词假定与在规定交谈空间的主题识别信息进行比较。在步骤S404,语音识别单元200确定在所查询的单词假定中是否存在与主题识别信息一致的一个单词假定。如果存在一个单词假定,则语音识别单元200将该单词假定作为识别结果输出到会话控制单元300(步骤S405)。如果不存在一个单词假定,则语音识别单元200根据所计算的单词假定的相似性,将具有最高相似性的一个单词假定作为识别结果输出到会话控制单元300(步骤S406)。
(1-1-3.语音识别字典存储器)
语音识别字典存储器700存储与标准语音信号相对应的字符串。在比较的基础上,语音识别单元200对与所接收到的语音信号相对应的字符串识别一个单词假定,然后将该识别的单词假定作为字符串信号(标识结果)输出给会话控制单元300。
(1-1-4.语句分析单元)
下面将参照图5描述语句分析单元400的结构。
语句分析单元400分析在输入单元100或语音识别单元200处识别的字符串。语句分析单元400包括字符串识别部410、语素提取部420、语素数据库430、输入类型确定部440、和话语类型数据库450。字符串识别部410将在输入单元100或语音识别单元200处识别的字符串划分成段。段是指在一定程度尽可能多地划分字符串而不破坏语法意义而产生的语句。具体地,当字符串包括超过一定级别的时间间隔时,该字符串识别部410在那部分划分该字符串。该字符串识别部410将所产生的字符串输出到语素提取部420和输入类型确定部440。下面将要描述的“字条串”是指一个语句的字符串。
(1-1-4-1.语素提取单元)
基于由在字符串识别部410划分而产生的语句的字符串,语素提取部420从该语句的字符串中提取组成该字符串的最小单元的语素作为第一语素信息。在所述实施例中,语素是指在字符串显示的单词结构的最小单元。单词结构的最小单元可以语音的一部分,例如包括名词、形容词和动词的语音。
在所述实施例中,如图6所示,语素被表示成m1、m2、m3......。更详细地,当从字符串识别部410接收字符串时,语素提取部420将所接收到的字符串与存储在语素数据库430中的语素组(所述语素组被准备为语素字典,在语素字典中,方位单词(direction word)、读法、和部分语音按属于语音的各个部分的语素被描述)进行比较。在比较的基础上,语素提取部420从字符串中提取与所存储的语素组中的一些匹配的语素(m1、m2......)。除了所提取的语素之外的语素(n1、n2、n3......)可以是例如助动词。
语素提取部420将所提取的语素作为第一语素信息输出到主题识别信息查询部350。注意的是,第一语素信息不必被结构化。在所述实施例中,结构化是指基于语音的部分对包含在字符串中的语素进行分类和排列。例如,字符串被划分成语素,然后语素被以诸如主语、宾语和谓语之类的规定的顺序排列。所述实施例即使使用结构化的第一语素信息也可以实现。
(1-1-4-2.输入类型确定部)
输入类型确定部440基于在字符串识别部410标识的字符串,确定话语的内容的类型(话语类型)。在所述实施例中,所述话语类型是用于标识所述话语的内容的类型的信息,是指例如图7中所示的“话语的语句类型”中的一个。
在上述实施例中,“话语的语句类型”包括陈述句(D:Declaration),时间语句(T:Time),地点语句(L:Location),否定语句(N:Negation)等,如图7所示。这些类型的语句以肯定句和疑问句形成。陈述句是指表示用户的意见或想法的语句。在所述实施例中,例如,图7中所示的语句“我喜欢Sato”是肯定句。位置语句是指包括位置的概念的语句。否定句是指否定陈述句的语句。图7示出了“话语的语句类型”的示例性语句。
在所述实施例中,当输入类型确定部440确定“话语的语句类型”时,输入类型确定部440使用图8中所示的用来确定其是陈述句的陈述性表达字典、用于确定其是否定句的否定性表达字典等等。具体地,当从字符串识别部410接收字符串时,输入类型确定部440基于字符串将所接收的字符串与存储在话语类型数据库450中的字典进行比较。在比较的基础上,输入类型确定部440从所述字符串中提取与所述字典相关的元素。
基于所提取的元素,输入类型确定部440确定“话语的语句类型”。当字符串包括例如声明一个事件的元素时,输入类型确定部440确定包括所述元素的字符串是陈述句。输入类型确定部440输出所确定的“话语的语句类型”到答复查询部380。
(1-1-5.会话数据库)
下面将参照图9描述会话数据库500中存储的数据的结构。
如图9所示,会话数据库500存储多条用于识别会话的主题的主题识别信息810。各条主题识别信息810与另外一条主题识别信息810相关联。例如,如果一条主题识别信息C(810)被识别,则与该条主题识别信息C(810)相关联的三条主题识别信息A(810)、B(810)、D(810)也被识别。
在所述实施例中,一条主题识别信息是指与由用户输入的内容或将被输出给用户的答复语句相关的关键词。
各条主题识别信息810与一个或多个主题标题820相关联。每个主题标题820包括一个字符、多个字符串、或通过结合这些所形成的语素。每个主题标题820与将要输出到用户的答复语句830相关联。多个答复类型分别与答复语句830相关联,每个答复类型表示所述答复语句830的一个类型。
下面将描述一条主题识别信息810与另外一条主题识别信息810之间的关联性。在所述实施例中,信息X与信息Y之间的关联是指,如果信息X被读出,则与信息X关联的信息Y可以被读出。例如,在信息X的数据中存储有用于读取信息Y的信息的状态被称为“信息Y与信息X关联”。
在所述实施例中,如图10所示,每条主题识别信息相对于另外一条主题识别信息以清楚的关系被存储为上位概念、下位概念、同义词或反义词(未示出)。例如,作为主题识别信息810A(电影)的上位概念的主题识别信息810B(娱乐)与主题识别信息810A相关联并被存储在高于主题识别信息810A(电影)的上层中。
还有,作为主题识别信息810A(电影)的下位概念的主题识别信息810C1(电影导演)、主题识别信息810C2(领衔主演)、主题识别信息810C3(发行公司)、主题识别信息810C4(上映时间)、主题识别信息810D1(七个日本武士)、主题识别信息810D2(Ran,乱)、主题识别信息810D3(保镖)......都与主题识别信息810A(电影)相关联,且存储在低于主题识别信息810A(电影)的下层。
同义词900与主题识别信息810A(电影)相关联。例如,同义词900(工作、内容、电影院)作为主题识别信息810A的关键词“电影”的同义词而被存储。由此,在关键词“电影”没有包含于话语中的情况下,如果关键词“工作”、“内容”、“电影院”中至少一个包含于所述话语中,则会话控制器1可以将主题识别信息810A处理为包含于所述话语中的主题识别信息。
当会话控制器1标识主题识别信息810时,会话控制器1可以参照会话数据库500所存储的内容以高速查询且提取与识别的主题识别信息810相关联的另外的主题识别信息810以及主题识别信息810的主题标题820或答复语句830。
下面将参照图11描述主题标题820的数据结构。
主题识别信息810D1、主题识别信息810D2、主题识别信息810D3......分别包括主题标题8201、8202、......、主题标题8203、8204、......、主题标题8205、8206、......。在所述实施例中,如图11所示,各个主题标题820包括第一识别信息1001、第二识别信息1002、以及第三识别信息1003。第一识别信息1001指的是形成主题的主要语素。例如,第一识别信息1001可以是语句的主语。第二识别信息1002指的是具有与第一识别信息1001紧密相关的语素。例如,第二识别信息1002可以是宾语。第三识别信息1003指的是表示宾语动作或修饰名词的语素等。例如,第三识别信息1003可以是动词、副词或形容词。注意的是,即使从这些识别信息理解了语句的内容,第一识别信息1001、第二识别信息1002、以及第三识别信息1003可以有另外的含义(语音的另外部分)。
如图11所示,当例如主语是“七个日本武士”,形容词是“有趣的”时,主题标题8202(第二语素信息)包括包含于第一识别信息1001中的语素“七个日本武士”以及包含于第三识别信息1003中的语素“有趣的”。注意的是,在第二识别信息1002中显示“*”是因为主题标题8202没有包含在第二识别信息1002一项中任何语素。
主题标题8202(七个日本武士;*,有趣的)具有“七个日本武士是有趣的”的含义。下面,第一识别信息1001、第二识别信息1002、以及第三识别信息1003以从左至右的顺序包含在主题标题8202的括号中。当主题标题820不包含识别信息项中的任何语素时,在那部分显示“*”。
注意的是,形成主题标题820的识别信息可能具有另外的识别信息(例如第四识别信息)。
答复语句830将参照图12进行描述。如图12所示,答复语句830被分类成不同的类型(反应类型),如,陈述(D:Declaration),时间(T:Time),地点(L:Location),否定(N:Negation),以使答复适用于由用户所提供的话语的语句类型。肯定句被标示为“A”,而疑问句被标示为“Q”。
主题识别信息810的数据结构将参照图13进行描述。如图13所示,主题识别信息810“Sato”与多个主题标题(820)1-1、1-2、......相关联。主题标题(820)1-1、1-2、......分别与答复语句(830)1-1、1-2、......相关联。为各种反应类型准备了答复语句830。
当主题标题(820)1-1例如是(Sato;*;喜欢){这些是被提取的包含于“我喜欢Sato”中的语素}时,与主题标题(820)1-1相关联的答复语句(830)1-1包括(DA:陈述性的肯定句“我也喜欢Sato”)和(TA:时间肯定性语句“我喜欢正在击球的Sato”)。下面将要被描述的答复查询部380参照从输入类型确定部440的输出查询与主题标题820相关联的答复语句830之一。
每一条下一计划指定信息840与每一答复语句830相关联。下一计划指定信息840是用于响应用户的话语指定将要优先输出的答复语句(后面称为下一答复语句)。如果下一计划指定信息840是用于标识下一答复语句的信息,则我们可以定义任何信息为下一计划指定信息840。例如,用于识别存储在会话数据库500中的所有答复语句至少之一的答复语句ID被定义为下一计划指定信息840。
在所述实施例中,下一计划指定信息840被描述为用于由答复语句识别下一答复语句的信息(例如,答复语句ID)。但是,下一计划指定信息840可以是用于由主题识别信息810和主题标题820识别下一答复语句的信息。例如,主题识别信息ID和主题标题ID被定义为下一计划指定信息840。在这种情况下,下一答复语句被称为下一答复语句组,因为多个答复语句被指定为下一答复语句。包含于下一答复语句组中的任何答复语句被输出为答复语句。
(1-1-6.会话控制单元)
下面将参照图5描述会话控制单元300的结构。
会话控制单元300控制会话控制器1中的结构元件(语音识别单元200、语句分析单元400、会话数据库500、输出单元600、和语音识别字典存储器700)之间的数据传递,且具有响应用户话语确定并输出答复语句的功能。
如图5所示,会话控制单元300包括管理部310、计划会话处理部320、交谈空间会话控制处理部330、以及CA会话处理部340。
(1-1-6-1.管理部)
管理部310存储交谈历史且具有更新交谈历史的功能。管理部310还具有根据来自主题识别信息查询部350、省略句补充部360、主题查询部370和/或答复查询部380的要求,发送部分或全部交谈历史给主题识别信息查询部350、省略句补充部360、主题查询部370和/或答复查询部380的功能。
(1-1-6-2.计划会话处理部)
计划会话处理部320执行计划且具有根据所述计划建立用户与会话控制器1之间的会话的功能。注意的是,所述计划是指按照规定的顺序提供预定的答复给用户。
计划会话处理部320还具有响应用户话语按照规定的顺序输出所述预定答复的功能。
如图14中所示,计划空间1401其中包括多个计划1402(计划1、2、3、4)。计划空间1401是一组存储在会话数据库500中的所述多个计划1402。会话控制器1选择提前定义的在起动会话控制器1时或起动一会话要使用的一个计划1402,或响应各用户话语的内容选择计划空间1401中的任一计划1402。然后,会话控制器1通过使用所选择的计划1402输出与用户话语相对应的答复语句。
如图15所示,每一计划1402其中包括答复语句1501以及与答复语句1501相关联的下一计划指定信息1502。下一计划指定信息1502是识别包括输出给用户的答复语句(下一候选答复语句)1501的计划1402的、随着与其相关的答复语句1501之后的信息。计划1(1402)其中包括执行计划1时会话控制器1输出的答复语句A(1501)以及与所述答复语句A(1501)相关联的下一计划指定信息1502。下一计划指定信息1502是用于识别包括作为对所述答复语句A(1501)的下一候选答复语句的答复语句B(1501)的计划2(1402)。以同样的方式,计划2(1402)其中包括答复语句B(1501)和与答复语句B(1501)相关联的下一计划指定信息1502。下一计划指定信息1502是用于识别另一计划的信息(ID:043),该另一计划包括作为对所述答复语句B(1501)的下一候选答复语句的另一答复语句。
因此,计划1402经下一计划指定信息1502与另一计划相互链接,这实现了将一系列内容输出给用户的计划会话。即,有可能响应用户话语,通过将一个人想要告诉的内容(说明性的语句、声明语句、疑问等)划分为多个答复语句然后准备所述划分的答复语句的顺序作为计划,按顺序将向用户提供答复语句。注意的是,响应对于前面答复语句的用户话语,将包含于由下一计划指定信息1502所指定的计划1402中的答复语句1501马上输出给用户。例如,在与用户进行一个关于除了当前计划之外的主题的对话之后,会话控制器1可以将包含于由下一计划指定信息1502所指定的计划1402中的答复语句1501输出给用户。
在图15中所示的答复语句1501与图13中所示的答复语句830之一对应。还有,在图15中所示的下一计划指定信息1502与图13中所示的下一计划指定信息840对应。
在图15中计划1402之间的链接被限定到一维矩阵。如图16所示,计划1′(1402)其中包括一个答复语句A′(1501)和与包含于计划2′、3′中的两个答复语句B′、C′(1501)分别相关联的两条下一计划指定信息1502(IDs:002′、003′)。可选地,会话控制器1选择答复语句B′、C′(1501)中之一并在将答复语句A′(1501)输出给用户之后完成计划1′(1402)。因此,计划1402之间的链接可以是树形的矩阵或是网状矩阵。
每一计划1402具有一条或多条下一计划指定信息1502。注意的是,对于会话的结束,计划1402中可以没有下一计划指定信息1502。
如图17所示,计划14021、14022、14023、14024分别与用于通知用户关于危机管理的信息的答复语句15011、15012、15013、15014对应。答复语句15011、15012、15013、15014总体上形成一个连贯语句(说明性语句)。计划14021、14022、14023、14024其中包括ID数据17021、17022、17023、17024,其分别具有值1000-01、1000-02、1000-03、1000-04。注意的是,在ID数据的连字符之后的数字表示相关联的计划的输出顺序。计划14021、14022、14023、14024其中还包括下一计划指定信息15021、15022、15023、15024,其分别具有值1000-02、1000-03、1000-04、1000-0F。在下一计划指定信息15024连字符之后的数字“0F”表示答复语句15014是连贯语句的末尾因为在答复语句15014之后没有要输出的计划。
在这个例子中,如果用户话语是“请告诉我当发生大地震时应采用的危机管理”,则计划会话处理部320开始执行该系列计划。更详细地,当计划会话处理部320接收用户话语“请告诉我当发生大地震时应采用的危机管理”时,计划会话处理部320检索计划空间1401并检查是否有包括与所述用户话语对应的答复语句15011的计划14021。这里,包含于计划14021中的用户话语字符串17011对应于用户话语“请告诉我当发生大地震时应采用的危机管理”。
如果计划会话处理部320发现计划14021,则计划会话处理部320查询包含于计划14021中的答复语句15011。然后,计划会话处理部320输出答复语句15011作为对用户话语的答复,且参照下一计划指定信息15021识别下一候选答复语句。
接下来,当计划会话处理部320在输出答复语句15011之后经输出单元100、语音识别单元200等接收另外的用户话语时,计划会话处理部320检查是否输出由下一计划指定信息15021所指定的计划14022中所包含的答复语句15012。更具体地,计划会话处理部320将所接收到的用户话语与和答复语句15012相关联的用户话语字符串17012或主题标题820(图17中未示出)比较,并确定是否彼此相关。如果它们彼此相关,则计划会话处理部320输出答复语句15012作为对用户话语的答复,且参照下一计划指定信息15022识别下一候选答复语句。
用同样的方式,计划会话处理部320根据一系列用户话语转移计划14023、14024并输出答复语句15013、15014。计划会话处理部320在完成答复语句15014的输出的时候结束计划执行。因此,计划会话处理部320可以通过依次执行计划14021、14022、14023、14024以以前所定义的顺序向用户提供会话内容。
(1-1-6-3.交谈空间会话控制处理部)
如图5所示,交谈空间会话控制处理部330包括主题识别信息查询部350、省略句补充部360、主题查询部370以及答复查询部380。管理部310控制会话控制单元300的整体。
交谈历史是用于标识用户与会话控制器1之间的会话的主题或主语的信息,且包括注释的主题识别信息、注释的主题标题、用户输入语句主题识别信息、以及答复语句主题识别信息中的至少一个。注释的主题识别信息、注释的主题标题、答复语句主题识别信息不限于由最后的会话所定义的信息。它们可以是在指定的过去的时段期间变成它们的信息或是它们的积累的记录。
(1-1-6-3-1.主题识别信息查询部)
主题识别信息查询部350将在语素提取部420所提取的第一语素信息与多条主题识别信息相比较,且从所述多条主题识别信息中查询与形成部分第一语素信息的语素对应的一条主题识别信息。具体地,当从语素提取部420所收到的第一语素信息是两个语素“Sato”和“喜欢”时,主题识别信息查询部350将所收到的第一语素信息与主题识别信息组进行比较。
在比较的基础上,当主题识别信息组包括形成部分第一语素信息(例如“Sato”)作为注释的主题标题820focus的语素时,主题识别信息查询部350输出注释的主题标题820focus给答复查询部380。这里,我们使用参考数820focus以区分上次所查询的主题标题820与另外的主题标题820。另一方面,当主题识别信息组不包括形成部分第一语素信息(例如“Sato”)作为注释的主题标题820focus的语素时,主题识别信息查询部350基于第一语素信息确定用户输入语句主题识别信息,且输出所接收到的第一语素信息及所确定的用户输入语句主题识别信息到省略句补充部360。这里,用户输入语句主题识别信息指的是对应于包含于第一语素信息中多个语素中的一语素的主题识别信息,该语素与用户所说的内容有关或可能与用户所说的内容有关。
(1-1-6-3-2.省略句补充部)
省略句补充部360利用上次所查询的主题识别信息810(以后称为“注释的主题识别信息”)以及包含于前面答复语句中的主题识别信息810(以后称为“答复语句主题识别信息”),通过补充第一语素信息产生各种补充的第一语素信息。例如,如果用户话语是“喜欢”,则省略句补充部360增加注释的主题识别信息“Sato”到第一语素信息“喜欢”且产生补充的第一语素信息“Sato,喜欢”。
即,用作为“W”的第一语素信息,以及作为“D”的一组注释的主题识别信息和答复语句主题识别信息,省略句补充部360增加组“D”的一个或多个元素到第一语素信息“W”且产生补充的第一语素信息。
用这种方式,当利用第一语素信息所形成的语句作为日语是省略句且是不清楚的时候,省略句补充部360可以使用组“D”以增加组“D”的一个或多个元素(例如Sato)到第一语素信息“W”。结果,省略句补充部360可以使第一语素信息“喜欢”成为补充的第一语素信息“Sato,喜欢”。这里,补充的第一语素信息“Sato,喜欢”对应于用户话语“我喜欢Sato”。
即,即使用户话语的内容形成一个省略句,省略句补充部360也可以通过使用组“D”补充该省略句。结果,甚至当由第一语素信息组成的语句是省略句时,省略句补充部360可以使该语句成为正确的日语。
基于组“D”,省略句补充部360检索与补充的第一语素信息相关的主题标题820。当省略句补充部360发现与与补充的第一语素信息相关的主题标题820时,省略句补充部360输出所述主题标题820到答复查询部380。答复查询部380可以基于在省略句补充部360所检索到的适当的主题标题820输出最适合于用户话语的内容的答复语句830。
省略句补充部360不限增加组“D”到第一语素信息。基于所注释的主题标题,省略句补充部360可以增加包含于形成主题标题的第一识别信息、第二识别信息、第三识别信息中的任何一个中的语素到所提取的第一语素信息。
(1-1-6-3-3.主题查询部)
当省略句补充部360没有确定主题标题820时,主题查询部370将第一语素信息与和用户输入语句主题识别信息相关联的主题标题820相比较,并且从主题标题820中查询最适于第一语素信息的主题标题820。
更详细地,当主题查询部370从省略句补充部360接收检索命令信号时,主题查询部370基于包含于所接收到的检索命令信号中的用户输入语句主题识别信息和第一语素信息,从与用户输入语句主题识别信息相关联的主题标题820中查询最适于第一语素信息的主题标题820。主题查询部370将所查询到的主题标题820作为检索结果信号输出到答复查询部380。
例如,如图13所示,由于所接收到的第一语素信息“Sato,喜欢”包括主题识别信息810“Sato”,所以主题查询部370识别主题识别信息810“Sato”且将与主题识别信息810“Sato”相关联的主题标题(820)1-1、1-2、......与所接收到的第一语素信息“Sato,喜欢”进行比较。
基于比较的结果,主题查询部370从主题标题(820)1-1、1-2、......中查询与所接收到的第一语素信息“Sato,喜欢”相同的主题标题(820)1-1“Sato;*;喜欢”。主题查询部370将所查询到的主题标题(820)1-1“Sato;*;喜欢”作为检索结果信号输出到答复查询部380。
(1-1-6-3-4.答复查询部)
基于在省略句补充部360或主题查询部370所查询的主题标题820,答复查询部380查询与主题标题相关联的答复语句。还有,基于在主题查询部370所查询的主题标题820,答复查询部380将与主题标题820相关联的不同类型的反应与在输入类型确定部440所确定的话语的类型相比较。当比较的基础上,答复查询部380从反应的类型中查询与所确定的话语类型相同的反应类型。
例如,如图13所示,当在主题查询部380所查询的主题标题是主题标题1-1“Sato;*;喜欢”时,答复查询部380从与主题标题1-1相关联的答复语句1-1(DA,TA等)中识别反应类型(DA),该反应类型(DA)与在输入类型确定部440所确定的话语的语句类型(如DA)相同。在识别反应类型(DA)的基础上,答复查询部380基于反应类型(DA)查询与所识别的反应类型(DA)相关联的答复语句1-1“我也喜欢Sato”。
这里,在“DA”、“TA”等中的“A”是指肯定形式。当话语类型和反应类型包括“A”时,表示对某件事的肯定。话语类型和反应类型可以包括“DQ”、“TQ”等的类型。在“DQ”、“TQ”等中的“Q”是指关于一件事的问题。
当反应类型是疑问形式(Q)时,与反应类型相关联的答复语句被作成肯定形式(A)。以肯定形式(A)建立的答复语句可以是用于答复一个问题的语句。例如,当话语的语句是“你曾经操作过自动售货机吗?”时,话语的语句类型是疑问形式(Q)。与疑问形式(Q)相关联的答复语句例如可以是“我以前操作过自动售货机”(肯定形式(A))。
另一方面,当反应类型是肯定形式(A)时,与该反应类型相关联的答复语句被作成疑问形式(Q)。以疑问形式(Q)建立的答复语句可以是用于反问话语的内容的疑问句或用于找出某件事的疑问句。例如,当说出的语句是“我喜欢玩自动售货机”时,该话语语句的话语类型是肯定形式(A)。与肯定形式(A)相关联的答复语句例如可以是“你喜欢玩自动售货机吗?”(用于找出某件事的疑问句(Q))。
答复查询部380将所查询到的答复语句830作为答复语句信号输出到管理部310。在从答复查询部380接收到答复语句信号时,管理部310将所接收到的答复语句信号输出到输出单元600。
(1-1-6-4.CA会话处理部)
当计划会话处理部320或交谈空间会话控制处理部330没有确定对用户的答复语句时,CA会话处理部340输出答复语句使得会话控制器1可以根据用户话语的内容继续与用户说话。
下面将参照图1再描述会话控制器1的结构。
(1-1-7.输出单元)
输出单元600输出在答复查询部380所查询到的答复语句。输出单元600可以是例如扬声器或显示器。具体地,当从答复查询部380接收到答复语句时,输出单元600基于答复语句用声音输出所接收到的答复语句(例如,我也喜欢Sato)。
下面将参照图18到图22描述会话控制器1的操作。
当会话控制单元300接收用户话语时,执行图18中所示的主处理。在执行主处理时,对所接收的用户话语的答复语句被输出以建立用户和会话控制器1之间的会话(对话)。
在步骤S1801,计划会话处理部320执行计划会话控制处理。计划会话控制处理是用于实现一个计划的处理。
下面将参照图19、20描述计划会话控制处理的一个例子。
在步骤S1901,计划会话处理部320检查基本控制状态信息。关于计划的执行是否完成的信息被作为基本控制状态信息存储于某存储区域。基本控制状态信息被用来描述计划的基本控制状态。
如图21所示,称为情节的计划类型具有四个基本控制状态(连接、取消、维护、以及继续)
(1)连接
当用户话语与正在执行的计划1402相关时,更具体地,与对应于计划1402的主题标题820或例句1701相关时,在基本控制状态信息中设置连接。
在连接中,计划会话处理部320完成计划1402然后转移到与由下一计划指定信息1502所指定的答复语句1501相对应的另一计划1402。
(2)取消
当用户话语的内容被确定要求完成计划1402或用户的兴趣被确定为转移不是正在执行的一个计划的一件事时,在基本控制状态信息中设置取消。在取消中,计划会话处理部320检索是否存在除了处于取消的那个计划1402外的另一计划1402,其与用户话语相对应。如果有另一计划1402,则计划会话处理部320开始该另一计划1402的执行。如果没有另一计划1402,则计划会话处理部320结束一系列计划的执行。
(3)维护
在用户话语与正在执行的计划1402不相关时,更具体地,与对应于计划1402的主题标题820或例句1701不相关时,且用户话语不对应于基本控制状态“取消”时,在基本控制状态信息中设置维护。
在维护中,计划会话处理部320确定在接收用户话语时是否再执行在待处理/停止状态的计划1402。如果用户话语不适于再执行计划1402(如,用户话语与对应于该计划1402的主题标题820或例句1701不相关),则计划会话处理部320开始执行另一计划1402或执行后面将要描述的交谈空间会话控制处理(步骤S1802)。如果用户话语适于再执行计划1402,则计划会话处理部320基于所存储的下一计划指定信息1502输出答复语句1501。
还有,在维护中,如果用户话语与相关联的计划1402不相关,则计划会话处理部320检索另一计划1402以便输出一个答复语句而不是与相关联的计划1402相对应的答复语句1501,或者执行交谈空间控制处理。但是,如果用户话语再与相关联的计划1402相关,则计划会话处理部320再执行相关联的计划1402。
(4)继续
当用户话语与包含于正在执行的计划1402中的答复语句1501不相关、用户话语的内容不对应于基本控制状态“取消”、且基于用户话语要被解释的用户的意图是不清楚时,在基本控制状态信息中设置继续。
在继续中,计划会话处理部320确定在接收用户话语时是否再执行在待处理/停止状态的计划1402。如果用户话语不适于再执行计划1402,则计划会话处理部320执行下面将描述的CA会话控制处理,使得输出答复语句以引导来自用户的话语。
在步骤S1902,计划会话处理部320确定在基本控制状态信息中设置的基本控制状态是否是连接。如果基本控制状态是连接,则处理进行到步骤S1903。在步骤S1903,计划会话处理部320确定答复语句1501是否是正在执行的计划1602中的最后的答复语句。
如果答复语句1501是最后的答复语句,则处理进行到步骤S1904。在步骤S1904,计划会话处理部320在计划空间中检索以确定是否开始另一计划1402,因为计划会话处理部320已经传递了所有要答复用户的内容。在步骤S1905,计划会话处理部320确定在计划空间中是否有与用户话语对应的另一计划1402。如果没有另一计划1402,则计划会话处理部320结束计划会话控制处理,因为没有要提供给用户的任何计划1402。
如果有另一计划1402,则处理进行到步骤S1906。在步骤S1906中,计划会话处理部320转移到另一计划1402,以开始执行该另一计划1402(包含于所述另一计划1402中的答复语句的输出)。
在步骤S1908中,计划会话处理部320输出包含于相关联的计划1402中的答复语句1501。答复语句1501被输出为对用户话语的答复,其提供要被发送到用户的信息。计划会话处理部320在步骤S1908中已经结束答复语句输出的时候结束计划会话控制处理。
另一方面,在步骤S1903,如果答复语句1501不是最后的答复语句,则处理进行到步骤S1907。在步骤S1907中,计划会话处理部320转移到与所输出的答复语句1501之后的答复语句即由下一计划指定信息1502所识别的答复语句1501相对应的计划1402。然后,处理进行到步骤S1908。
在步骤S1902,如果基本控制状态不是连接,则处理进行到步骤S1909。在步骤S1909,计划会话处理部320确定在基本控制状态信息中设置的基本控制状态是否是取消。如果基本控制状态是取消,则处理进行到步骤S1904,因为没有要继续的计划1402。如果基本控制状态不是取消,则处理进行到步骤S1910。
在步骤S1910,计划会话处理部320确定在基本控制状态信息中设置的基本控制状态是否是维护。如果基本控制状态是维护,计划会话处理部320检索用户是否对待处理/停止状态的计划1402感兴趣。如果用户对计划1402感兴趣,则计划会话处理部320再执行待处理/停止状态的计划1402。
更详细地,如图20所示,在步骤S2001计划会话处理部320检索在待处理/停止状态的计划1402,然后在步骤S2002确定用户话语是否与所述待处理/停止状态的计划1402相关。如果用户话语与所述计划1402相关,则处理进行到步骤S2003。在步骤S2003,计划会话处理部320转移到与用户话语相关的计划1402,然后处理进行到步骤S1908。因此,计划会话处理部320能够根据用户话语再执行待处理/停止状态的计划1402,这可以将包含于以前准备的计划1402的所有内容传递给用户。如果用户话语与所述计划1402无关,则处理进行到步骤S1904。
在步骤S1910,如果基本控制状态不是维护,则计划会话处理部320结束计划会话控制处理而不输出答复语句,因为基本控制状态是继续。
如图18所示,当结束计划会话控制处理时,会话控制单元300执行交谈空间会话控制处理(步骤S1802)。注意的是,当答复语句在计划会话控制处理中输出(步骤S1801)时,会话控制单元300直接执行基本控制信息更新处理(步骤S1804)而不执行交谈空间会话控制处理(步骤S1802)和CA会话控制处理(步骤S1803),然后结束主处理。
如图22所示,在步骤S2201,输入单元100接收用户提供的用户话语。更具体地,输入单元100接收实现用户话语的声音。输入单元100将与所接收的话语内容对应的语音作为语音信号输出到语音识别单元200。注意的是,输入单元100可以接收由用户输出的字符串(例如以文本格式输入的字符数据)而不是声音。在这种情况下,输入单元100是用于输入字符信息的诸如键盘或接触板之类的字符输入设备。
在步骤S2202,语音识别单元200基于由输入设备100所查询到的话语内容,识别与所述话语内容对应的字符串。更具体地,语音识别单元200在从输入单元100接收到语音信号时识别与所述语音信号对应的单词假定(候选)。然后,语音识别单元200查询与所标识的单词假定对应的字符串,并将所查询到的字符串输出到会话控制单元300(交谈空间会话控制处理部330)作为字符串信号。
在步骤S2203,字符串识别部410将在语音识别单元200识别的字符串划分成段。段是指在一定程度上尽可能多地划分字符串而不破坏语法意义而产生的语句。更详细地,当字符串包括超过一定级别的时间间隙时,字符串识别部410在那部分划分所述字符串。字符串识别部410将所产生的字符串输出到语素提取部420和输入类型确定部440。优选的是,字符串识别部410在从键盘输入字符串的情况下在有标点符号或空隔的部分划分字符串。
在步骤S2204,基于在字符串识别部410识别的字符串,语素提取部420提取形成字符串的最小单元的语素作为第一语素信息。更详细地,当从字符串识别部410接收字符串时,语素提取部420将所接收到的字符串与以前存储在语素数据库430中的语素组相比较。所述语素组被准备为语素字典,在该语素字典中,方位单词、读法、部分语音、和屈折形式(inflected form)按属于相应语音部分的语素被描述。在比较时,语素提取部420从所接收到的字符串中提取与所存储的语素组中的一些匹配的语素(m1、m2......)。语素提取部420输出所提取的语素到主题识别信息查询部350作为第一语素信息。
在步骤S2205,输入类型确定部440基于在字符串识别部410识别的字符串,确定话语类型。具体地,当从字符串识别部410接收字符串时,输入类型确定部440基于所述字符串将所接收的字符串与存储在话语类型数据库450中的字典进行比较。当比较时,输入类型确定部440从所述字符串中提取与所述字典相关的元素。基于所提取的元素,输入类型确定部440确定各提取的元素属于哪个类型的话语语句。输入类型确定部440输出所确定的话语语句的类型到答复查询部380。
在步骤S2206,主题识别信息查询部350将在语素提取部420所提取的第一语素信息与注释的主题标题820focus相比较。如果形成部分第一语素信息的语素与所述注释的主题标题820focus相关,则主题识别信息查询部350输出所述注释的主题标题820focus给答复查询部380。如果形成部分第一语素信息的语素与所述注释的主题标题820focus不相关,则主题识别信息查询部350输出所接收到的第一语素信息及用户输入语句主题识别信息到省略句补充部360作为检索命令信号。
在步骤S2207,省略句补充部360基于从主题识别信息查询部350所接收到第一语素信息,增加注释的主题识别信息和答复语句主题识别信息到所接收到第一语素信息。更具体地,用作为“W”的第一语素信息、以及作为“D”的一组注释的主题识别信息和答复语句主题识别信息,省略句补充部360增加组“D”的一个或多个元素到第一语素信息“W”且产生补充的第一语素信息。然后,省略句补充部360将所述补充的第一语素信息和与所述组“D”相关联的所有主题标题820比较,并检索与所述补充的第一语素信息相关的主题标题820。如果有与所述补充的第一语素信息相关的主题标题820,则省略句补充部360输出所述主题标题820到答复查询部380。如果没有与所述补充的第一语素信息相关的主题标题820,则省略句补充部360输出所述第一语素信息及用户输入语句主题识别信息到主题查询部370。
在步骤S2208,主题查询部370将所述第一语素信息与和所述用户输入语句主题识别信息相比较,并且从主题标题820中查询最适于所述第一语素信息的主题标题820。更详细地,当主题查询部370从省略句补充部360接收检索命令信号时,主题查询部370基于包含于所接收到的检索命令信号中的用户输入语句主题识别信息和第一语素信息,从与用户输入语句主题识别信息相关联的主题标题820中查询最适于第一语素信息的主题标题820。主题查询部370将所查询到的主题标题820输出到答复查询部380作为检索结果信号。
在步骤S2209,基于在主题识别信息查询部350、省略句补充部360或主题查询部370查询到的主题标题820,答复查询部380将与主题标题820相关联的不同类型的反应与在输入类型确定部440所确定的话语的类型相比较。当比较时,答复查询部380从反应的类型中查询与所确定的话语类型相同的反应类型。例如,当答复查询部380从主题查询部370接收检索结果信号以及从输入类型确定部440接收话语类型时,答复查询部380基于与所接收的检索结果信号以及所接收的话语类型对应的主题标题,来识别在与所述主题标题相关联的反应类型中与话语类型(如DA)相同的反应类型。
在步骤S2210,答复查询部380经管理部310将在步骤S2209查询到的答复语句830输出到输出单元600。当输出单元600从管理部310接收答复语句830时,输出单元600输出所接收到的答复语句830。
如图18所示,当结束交谈空间会话控制处理时,会话控制单元300执行CA会话控制处理(步骤S1803)。注意的是,当答复语句在交谈空间会话控制处理中输出(步骤S1802)时,会话控制单元300直接执行基本控制信息更新处理(步骤S1804)而不执行交谈空间会话控制处理(步骤S1803),然后结束主处理。
在CA会话控制处理中,会话控制单元300确定用户话语是用于解释事物的话语、用于识别事物的话语、用于控诉或攻击事物的话语、或除了上述以外的话语,然后输出确定结果以及与用户话语内容对应的答复语句。由此,即使在计划会话控制处理或交谈空间会话控制处理中没有输出适合于用户话语的答复语句,会话控制单元300也可以输出允许会话流继续的过渡答复语句。
在步骤S1804中,会话控制单元300执行基本控制信息更新处理,在基本控制信息更新处理中,当计划会话处理部320输出答复语句时,会话控制单元300的管理部310在基本控制信息中设置连接。当计划会话处理部320停止输出答复语句时,管理部310在基本控制信息中设置取消。当交谈空间会话控制处理部330输出答复语句时,管理部310在基本控制信息中设置维护。当CA会话处理部340输出答复语句时,管理部310在基本控制信息中设置继续。
在基本控制信息更新处理中设置的基本控制信息在要被用来继续或再继续一个计划的计划会话控制处理(步骤S1801)中引用。
如上所述,会话控制器1可以根据用户话语实现一个以前准备的计划,且每当接收到用户话语时,通过执行主处理对不包含于计划中的主题进行精确地响应。
(B.第二实施例)
根据第二实施例的会话控制器1处理被称为引导交谈的类型的计划。引导交谈指的是通过重复对用户的问题引导用户获取信息,诸如结果或意见。存储在会话控制器1的会话数据库500中的一部分计划1402具有一系列用于指导用户的问题作为答复语句。包含于具有一系列问题的各计划1402中的下一计划指定信息是用于指定多个下一候选答复语句的信息。
在第二实施例中,将描述不同于第一实施例的结构和操作而省略描述与第一实施例相同的结构和操作。
如图23所示,计划140210、140211、140212、140213、140214、140215分别具有对来自扶养小孩的母亲的儿童保育的咨询的相应答复语句150110、150111、150112、150113、150114、150115。在图23的例子中,计划140211、140213分别与计划140212、140214有选择性的关系。当计划140211(140212)和/或140213(140214)被选择时,计划140212(140211)和/或140214(140213)不被选择。
计划140210、140211、140212、140213、140214、140215其中包括ID数据170210、170211、170212、170213、170214、170215,其分别具有值2000-01、2000-02、2000-03、2000-04、2000-05、2000-06。计划140210、140211、140212、140213、140214、140215其中还包括下一计划指定信息150210、150211、150212、150213、150214、150215,其分别具有值2000-02和2000-03、2000-04和2000-05、2000-0F、2000-0F、2000-04和2000-06、2000-0F。下一计划指定信息150212、150213、150215的连字符后的数字“0F”表示答复语句150112、150113、150115是一系列问题的末尾,因为在答复语句150112、150113、150115之后就没有计划要输出了。
在图23的例子中,如果用户话语是“婴儿把头往墙上撞”,则计划会话处理部320开始执行该系列计划。更详细地,当计划会话处理部320接收用户话语“婴儿把头往墙上撞”时,计划会话处理部320检索计划空间1401并检查是否有包括与所述用户话语对应的答复语句150110的计划140210。这里,包含于计划140210中的用户话语字符串170110对应于用户话语“婴儿把头往墙上撞”。
如果计划会话处理部320发现计划140210,则计划会话处理部320查询包含于计划140210中的答复语句150110。然后,计划会话处理部320输出答复语句150110作为对用户话语的答复语句“婴儿有意识吗?”,且参照下一计划指定信息150210识别一个或多个下一候选答复语句。下一计划指定信息150210包括两个ID数据2000-02、2000-03。计划会话处理部320识别与两个ID数据2000-02、2000-03对应的两个计划140211、140212作为两个下一候选答复语句。
当用于回答答复语句“婴儿有意识吗?”的用户话语是“是”时,计划会话处理部320选择与用户话语对应的计划140211并且实现计划140211。然后,计划会话处理部320输出答复语句“婴儿瘫痪吗?或婴儿呼吸不规则吗?”且参照下一计划指定信息150211识别一个或多个下一候选答复语句。下一计划指定信息150211包括两个ID数据2000-04、2000-05。计划会话处理部320识别与两个ID数据2000-04、2000-05对应的两个计划140213、140214作为两个下一候选答复语句。
相对比,当用于回答答复语句“婴儿有意识吗?”的用户话语是“否”时,计划会话处理部320选择与用户话语对应的计划140212并且实现计划140212。然后,计划会话处理部320输出答复语句“请尽快打电话叫救护车!”且参照下一计划指定信息150212识别一系列问题的结束。最后,计划会话处理部320结束该计划会话处理。
当用于回答答复语句“婴儿瘫痪吗?或婴儿呼吸不规则吗?”的用户话语是“是”时,计划会话处理部320选择与用户话语对应的计划140213并且实现计划140213。然后,计划会话处理部320输出答复语句“请尽快打电话叫救护车!”且参照下一计划指定信息150213识别所述系列问题的结束。最后,计划会话处理部320结束该计划会话处理。
相对比,当用于回答答复语句“婴儿瘫痪吗?或婴儿呼吸不规则吗?”的用户话语是“否”时,计划会话处理部320选择与用户话语对应的计划140214并且实现计划140214。然后,计划会话处理部320输出答复语句“婴儿轻微地打哈欠或呕吐?”且参照下一计划指定信息150214识别一个或多个下一候选答复语句。下一计划指定信息150214包括两个ID数据2000-04、2000-06。计划会话处理部320识别与两个ID数据2000-04、2000-06对应的两个计划140213、140215作为两个下一候选答复语句。
当用于回答答复语句“婴儿轻微地打哈欠或呕吐?”的用户话语是“是”时,计划会话处理部320选择与用户话语对应的计划140213并且实现计划140213。然后,计划会话处理部320输出答复语句“请尽快打电话叫救护车!”且参照下一计划指定信息150213标识所述系列问题的结束。最后,计划会话处理部320结束该计划会话处理。
相对比,当用于回答答复语句“婴儿轻微地打哈欠或呕吐?”的用户话语是“否”时,计划会话处理部320选择与用户话语对应的计划140215并且实现计划140215。然后,计划会话处理部320输出答复语句“如果婴儿把头往墙上撞之后大声哭且在停止哭之后处于好的情绪,则这期间不用太过担心婴儿”且参照下一计划指定信息150215识别所述系列问题的结束。最后,计划会话处理部320结束该计划会话处理。
如图24所示,根据第二实施例的被称为情节的计划类型具有四个基本控制状态(达到目标、取消、维护、和提升)。
(1)达到目标
达到目标是与图21中所示的连接对应的基本控制状态。当用户话语与与正在执行的计划1402相关时,更详细地,与对应于计划1402的主题标题820或示例语句1701相关时,在基本控制状态信息中设置达到目标。在达到目标中,计划会话处理部320完成计划1402然后转移到与由下一计划指定信息1502所指定的答复语句1501相对应的另一计划1402。
(2)取消
取消是与图21中所示的取消对应的基本控制状态。当用户话语的内容被确定要求完成计划1402或用户的兴趣被确定是转移到不是正在执行的计划的事情时,在基本控制状态信息中设置取消。在取消中,计划会话处理部320检索是否存在除了处于取消的那个计划1402外的另一计划1402,其与用户话语相对应。如果有另一计划1402,则计划会话处理部320开始该另一计划1402的执行。如果没有另一计划1402,则计划会话处理部320结束一系列计划的执行。
(3)维护
维护是与图21中所示的维护对应的基本控制状态。在用户话语与正在执行的计划1402不相关时,更具体地,与对应于计划1402的主题标题820或例句1701不相关时,且用户话语不对应于基本控制状态“取消”时,在基本控制状态信息中设置维护。
在维护中,计划会话处理部320确定在接收用户话语时是否再执行在待处理/停止状态的计划1402。如果用户话语不适于再执行计划1402(如,用户话语与对应于该计划1402的主题标题820或例句1701不相关),则计划会话处理部320开始执行另一计划1402或执行后面将要描述的交谈空间会话控制处理(步骤S1902)。如果用户话语适于再执行计划1402,则计划会话处理部320基于所存储的下一计划指定信息1502输出答复语句1501。
还有,在维护中,如果用户话语与相关联的计划1402不相关,则计划会话处理部320检索另一计划1402以便输出一个答复语句而不是与相关联的计划1402相对应的答复语句1501,或者执行交谈空间控制处理。但是,如果用户话语再与相关联的计划1402相关,则计划会话处理部320再执行相关联的计划1402。
(4)提升
提升是与图21中所示的继续对应的基本控制状态。当用户话语与包含于正在执行的计划1402中的答复语句1501不相关、用户话语的内容不对应于基本控制状态“取消”、且基于用户话语要被解释的用户的意图是不清楚时,在基本控制状态信息中设置提升。
在提升中,计划会话处理部320确定在接收用户话语时是否再执行在待处理/停止状态的计划1402。如果用户话语不适于再执行计划1402,则计划会话处理部320执行上面所描述的CA会话控制处理使得输出答复语句,以引导来自用户的话语。
图25、26所示的计划会话控制处理处理被称为引导交谈的类型的计划,且除了在步骤S2502将“连接”改变成“达到目的”之外,其它都与图19中所示的计划会话控制处理相同。具体地,图25中的步骤S2501到S2510对应于图19中的步骤S1901到S1910,而图26中的步骤S2601到S2603对应于图20中的步骤S2001到S2003。
根据第二实施例的会话控制器1可以通过重复对于用户的问题,提供一个会话以允许用户获取其中以前准备的诸如结果或意见之类的信息。

Claims (4)

1.一种用于根据用户话语输出答复语句的会话控制器,其包括:
会话数据库,用于存储多个计划,其中每个计划具有答复语句和一条或多条下一候选指定信息,其中所述一条或多条下一候选指定信息用于在答复语句后指定将要被输出的下一候选答复语句;以及
计划会话单元,用于根据第一用户话语选择存储在所述会话数据库中的一个计划且输出所选择的计划具有的答复语句,以及根据第二用户话语选择所述计划具有的一条下一候选答复信息且基于所选择的那条下一候选答复信息输出下一候选答复语句,
其中,一部分计划具有作为答复语句的、用于引导用户获取想要的信息的一系列问题。
2.根据权利要求1所述的会话控制器,其中,所述计划会话单元在接收与所述下一候选答复语句不相关的第二用户话语或不清楚所述第二用户话语与所述下一候选答复语句之间是否存在关系时,抑制所述下一候选答复语句的输出,然后在接收与所抑制的下一候选答复语句相关的第三用户话语时输出所抑制的下一候选答复语句。
3.根据权利要求2所述的会话控制器,还包括:
交谈空间会话单元,用于根据第二用户话语输出关于与所抑制的下一候选答复语句无关的主题的答复语句。
4.根据权利要求3所述的会话控制器,还包括:
会话继续单元,用于在没有输出关于与所抑制的下一候选答复语句无关的主题的答复语句时,根据所述第二用户话语输出答复语句以继续用户与会话控制器之间的会话。
CN2006101357929A 2005-10-21 2006-10-20 会话控制器 Active CN1953055B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005307868A JP4849662B2 (ja) 2005-10-21 2005-10-21 会話制御装置
JP2005307868 2005-10-21
JP2005-307868 2005-10-21

Publications (2)

Publication Number Publication Date
CN1953055A CN1953055A (zh) 2007-04-25
CN1953055B true CN1953055B (zh) 2012-05-23

Family

ID=37986357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006101357929A Active CN1953055B (zh) 2005-10-21 2006-10-20 会话控制器

Country Status (3)

Country Link
US (1) US7949530B2 (zh)
JP (1) JP4849662B2 (zh)
CN (1) CN1953055B (zh)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8126713B2 (en) * 2002-04-11 2012-02-28 Shengyang Huang Conversation control system and conversation control method
US7693720B2 (en) 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7451579B2 (en) 2005-10-12 2008-11-18 Concrete Accessories, Inc. Reinforcement bar spacer wheel
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
JP5378717B2 (ja) * 2008-07-01 2013-12-25 株式会社ユニバーサルエンターテインメント 会話制御システム、並びに端末装置
JP5897240B2 (ja) * 2008-08-20 2016-03-30 株式会社ユニバーサルエンターテインメント 顧客対応システム、並びに会話サーバ
JP5149737B2 (ja) * 2008-08-20 2013-02-20 株式会社ユニバーサルエンターテインメント 自動会話システム、並びに会話シナリオ編集装置
US8326637B2 (en) 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US9171541B2 (en) 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
CN103457834B (zh) * 2013-08-18 2018-06-05 苏州量跃信息科技有限公司 即时通信中item项触发语音搜索的方法及客户端
US9905225B2 (en) * 2013-12-26 2018-02-27 Panasonic Intellectual Property Management Co., Ltd. Voice recognition processing device, voice recognition processing method, and display device
JP6024675B2 (ja) * 2014-01-17 2016-11-16 株式会社デンソー 音声認識端末装置、音声認識システム、音声認識方法
JP6390264B2 (ja) * 2014-08-21 2018-09-19 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム
CN107003996A (zh) 2014-09-16 2017-08-01 声钰科技 语音商务
US9898459B2 (en) 2014-09-16 2018-02-20 Voicebox Technologies Corporation Integration of domain information into state transitions of a finite state transducer for natural language processing
CN107003999B (zh) 2014-10-15 2020-08-21 声钰科技 对用户的在先自然语言输入的后续响应的系统和方法
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10192550B2 (en) 2016-03-01 2019-01-29 Microsoft Technology Licensing, Llc Conversational software agent
US10140988B2 (en) 2016-03-01 2018-11-27 Microsoft Technology Licensing, Llc Speech recognition
US10140986B2 (en) 2016-03-01 2018-11-27 Microsoft Technology Licensing, Llc Speech recognition
WO2018023106A1 (en) 2016-07-29 2018-02-01 Erik SWART System and method of disambiguating natural language processing requests
US10403273B2 (en) * 2016-09-09 2019-09-03 Oath Inc. Method and system for facilitating a guided dialog between a user and a conversational agent
US20190311716A1 (en) * 2016-10-06 2019-10-10 Sharp Kabushiki Kaisha Dialog device, control method of dialog device, and a non-transitory storage medium
CN109313649B (zh) * 2017-03-24 2022-05-31 微软技术许可有限责任公司 用于聊天机器人的基于语音的知识共享的方法和装置
JP6560730B2 (ja) * 2017-11-22 2019-08-14 日本瓦斯株式会社 対話形式で顧客ヒアリング、ガス器具販売および決済を行なう方法、コンピュータおよびプログラム
US11133010B1 (en) 2018-01-23 2021-09-28 United Services Automobile Association (Usaa) Intelligent agent for interactive service environments
US10997359B2 (en) 2018-04-27 2021-05-04 International Business Machines Corporation Real-time cognitive modifying a mark-up language document
JP6773074B2 (ja) * 2018-05-01 2020-10-21 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム
EP3576084B1 (de) * 2018-05-29 2020-09-30 Christoph Neumann Effiziente dialoggestaltung
CN108897872B (zh) * 2018-06-29 2022-09-27 北京百度网讯科技有限公司 对话处理方法、装置、计算机设备和存储介质
KR102098003B1 (ko) * 2018-10-11 2020-04-07 삼성생명보험주식회사 챗봇 구동 방법, 장치 및 컴퓨터 판독가능 매체
CN113127608A (zh) * 2019-12-31 2021-07-16 微软技术许可有限责任公司 计划引导的响应提供
JP7420109B2 (ja) * 2021-04-08 2024-01-23 トヨタ自動車株式会社 情報出力システム、サーバ装置および情報出力方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1419686A (zh) * 2000-10-30 2003-05-21 皇家菲利浦电子有限公司 模拟人际交互并利用相关数据装载外部数据库的用户接口/娱乐设备
WO2004051499A1 (ja) * 2002-12-02 2004-06-17 Sony Corporation 対話制御装置及び方法並びにロボット装置
JP2004325848A (ja) * 2003-04-25 2004-11-18 Nippon Telegr & Teleph Corp <Ntt> 音声対話制御方法、音声対話制御装置、音声対話制御プログラム
CN1664835A (zh) * 2005-03-30 2005-09-07 结信网络技术服务(上海)有限公司 企业智能客户服务系统

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2979430B2 (ja) 1990-11-02 1999-11-15 日本電信電話株式会社 通信文自動分割蓄積装置
JPH07282134A (ja) 1994-04-15 1995-10-27 Japan Aviation Electron Ind Ltd 注文用端末装置
US6173266B1 (en) * 1997-05-06 2001-01-09 Speechworks International, Inc. System and method for developing interactive speech applications
US6044347A (en) * 1997-08-05 2000-03-28 Lucent Technologies Inc. Methods and apparatus object-oriented rule-based dialogue management
JP3088364B2 (ja) 1997-11-05 2000-09-18 株式会社エイ・ティ・アール音声翻訳通信研究所 音声言語理解装置及び音声言語理解システム
US6411924B1 (en) * 1998-01-23 2002-06-25 Novell, Inc. System and method for linguistic filter and interactive display
JP3125746B2 (ja) * 1998-05-27 2001-01-22 日本電気株式会社 人物像対話装置及び人物像対話プログラムを記録した記録媒体
US6101492A (en) * 1998-07-02 2000-08-08 Lucent Technologies Inc. Methods and apparatus for information indexing and retrieval as well as query expansion using morpho-syntactic analysis
US6493671B1 (en) * 1998-10-02 2002-12-10 Motorola, Inc. Markup language for interactive services to notify a user of an event and methods thereof
US6321198B1 (en) * 1999-02-23 2001-11-20 Unisys Corporation Apparatus for design and simulation of dialogue
US6314402B1 (en) * 1999-04-23 2001-11-06 Nuance Communications Method and apparatus for creating modifiable and combinable speech objects for acquiring information from a speaker in an interactive voice response system
US6356869B1 (en) * 1999-04-30 2002-03-12 Nortel Networks Limited Method and apparatus for discourse management
TW501046B (en) * 1999-06-11 2002-09-01 Ind Tech Res Inst A portable dialogue manager
JP2001005488A (ja) * 1999-06-18 2001-01-12 Mitsubishi Electric Corp 音声対話システム
US6901402B1 (en) * 1999-06-18 2005-05-31 Microsoft Corporation System for improving the performance of information retrieval-type tasks by identifying the relations of constituents
US6553345B1 (en) * 1999-08-26 2003-04-22 Matsushita Electric Industrial Co., Ltd. Universal remote control allowing natural language modality for television and multimedia searches and requests
US6510411B1 (en) * 1999-10-29 2003-01-21 Unisys Corporation Task oriented dialog model and manager
JP2001357053A (ja) 2000-06-12 2001-12-26 Matsushita Electric Ind Co Ltd 対話装置
AU2001272009A1 (en) * 2000-06-16 2001-12-24 Healthetech, Inc. Speech recognition capability for a personal digital assistant
JP2002023783A (ja) * 2000-07-13 2002-01-25 Fujitsu Ltd 対話処理システム
JP2002032370A (ja) * 2000-07-18 2002-01-31 Fujitsu Ltd 情報処理装置
US7158935B1 (en) * 2000-11-15 2007-01-02 At&T Corp. Method and system for predicting problematic situations in a automated dialog
US7574362B2 (en) * 2001-03-14 2009-08-11 At&T Intellectual Property Ii, L.P. Method for automated sentence planning in a task classification system
JP4390402B2 (ja) * 2001-03-29 2009-12-24 富士通株式会社 知識情報管理方法、知識情報利用方法および知識情報管理装置
US6944594B2 (en) * 2001-05-30 2005-09-13 Bellsouth Intellectual Property Corporation Multi-context conversational environment system and method
US7305070B2 (en) * 2002-01-30 2007-12-04 At&T Labs, Inc. Sequential presentation of long instructions in an interactive voice response system
US7016849B2 (en) * 2002-03-25 2006-03-21 Sri International Method and apparatus for providing speech-driven routing between spoken language applications
US7197460B1 (en) * 2002-04-23 2007-03-27 At&T Corp. System for handling frequently asked questions in a natural language dialog service
JP3766369B2 (ja) 2002-10-24 2006-04-12 東芝テック株式会社 注文会計システム
US7177817B1 (en) * 2002-12-12 2007-02-13 Tuvox Incorporated Automatic generation of voice content for a voice response system
JP4110012B2 (ja) 2003-02-25 2008-07-02 株式会社ピートゥピーエー 会話制御装置及び会話制御方法
JP2004258902A (ja) 2003-02-25 2004-09-16 P To Pa:Kk 会話制御装置及び会話制御方法
JP4110011B2 (ja) 2003-02-25 2008-07-02 株式会社ピートゥピーエー 会話制御装置及び会話制御方法
JP4103085B2 (ja) * 2003-05-20 2008-06-18 日本電信電話株式会社 異言語間対話処理方法およびその装置、ならびにそのプログラムと記録媒体
JP2005010691A (ja) * 2003-06-20 2005-01-13 P To Pa:Kk 音声認識装置、音声認識方法、会話制御装置、会話制御方法及びこれらのためのプログラム
JP2005157494A (ja) * 2003-11-20 2005-06-16 Aruze Corp 会話制御装置及び会話制御方法
JP2006039120A (ja) * 2004-07-26 2006-02-09 Sony Corp 対話装置および対話方法、並びにプログラムおよび記録媒体
US7610191B2 (en) * 2004-10-06 2009-10-27 Nuance Communications, Inc. Method for fast semi-automatic semantic annotation
US8185399B2 (en) * 2005-01-05 2012-05-22 At&T Intellectual Property Ii, L.P. System and method of providing an automated data-collection in spoken dialog systems
US20070101394A1 (en) * 2005-11-01 2007-05-03 Yesvideo, Inc. Indexing a recording of audiovisual content to enable rich navigation

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1419686A (zh) * 2000-10-30 2003-05-21 皇家菲利浦电子有限公司 模拟人际交互并利用相关数据装载外部数据库的用户接口/娱乐设备
WO2004051499A1 (ja) * 2002-12-02 2004-06-17 Sony Corporation 対話制御装置及び方法並びにロボット装置
JP2004325848A (ja) * 2003-04-25 2004-11-18 Nippon Telegr & Teleph Corp <Ntt> 音声対話制御方法、音声対話制御装置、音声対話制御プログラム
CN1664835A (zh) * 2005-03-30 2005-09-07 结信网络技术服务(上海)有限公司 企业智能客户服务系统

Also Published As

Publication number Publication date
JP4849662B2 (ja) 2012-01-11
CN1953055A (zh) 2007-04-25
JP2007115144A (ja) 2007-05-10
US7949530B2 (en) 2011-05-24
US20070094003A1 (en) 2007-04-26

Similar Documents

Publication Publication Date Title
CN1953055B (zh) 会话控制器
CN1953056B (zh) 会话控制器
CN1953057B (zh) 会话控制器
CN1975857B (zh) 会话控制装置
CN1975858B (zh) 会话控制装置
EP2157570B1 (en) Automatic conversation system and conversation scenario editing device
US20210142794A1 (en) Speech processing dialog management
KR100563365B1 (ko) 계층적 언어 모델
CN1321401C (zh) 语音识别设备、语音识别方法、会话控制设备以及会话控制方法
KR102101044B1 (ko) 텍스트 투 스피치 및 시맨틱스에 기초한 오디오 인적 상호 증명 기법
CN110782870A (zh) 语音合成方法、装置、电子设备及存储介质
KR20210158344A (ko) 디지털 어시스턴트를 위한 머신 러닝 시스템
WO2017094913A1 (ja) 自然言語処理装置及び自然言語処理方法
JP4475628B2 (ja) 会話制御装置、会話制御方法並びにこれらのプログラム
McTear Rule-Based Dialogue Systems: Architecture, Methods, and Tools
Lhioui et al. Towards a Hybrid Approach to Semantic Analysis of Spontaneous Arabic Speech.
JP2005122549A (ja) 会話制御装置及び会話制御方法
Horndasch Using Contextual Information to Process Out-of-Vocabulary Words in Spoken Dialog Systems Ausnutzung von Kontextinformation bei der Verarbeitung von unbekannten
Horndasch Using Contextual Information to Process Out-of-Vocabulary Words in Spoken Dialog Systems
Lerjebo et al. Intelligent chatbot assistant: A study of Natural Language Processing and Artificial Intelligence
Papaioannou Designing coherent and engaging open-domain conversational AI systems
WO2024044083A1 (en) Multi-assistant device control
van de Loo et al. Effective weakly supervised semantic frame induction using expression sharing in hierarchical hidden Markov models
Jurcıcek et al. D5. 4: Proof-of-concept CLASSIC Appointment Scheduling system (” System 2”)
JP2005118371A (ja) ゲーム機

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent for invention or patent application
CB02 Change of applicant information

Address after: Tokyo, Japan, Japan

Applicant after: Global Entertainment Corporation

Co-applicant after: P TO PA Inc.

Address before: Tokyo, Japan, Japan

Applicant before: Aruze Corp.

Co-applicant before: P TO PA Inc.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: ARUZE CORP. TO: UNIVERSAL ENTERTAINMENT CO., LTD.

C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: Tokyo, Japan, Japan

Patentee after: Global Entertainment Corporation

Patentee after: KK P to PA

Address before: Tokyo, Japan, Japan

Patentee before: Global Entertainment Corporation

Patentee before: P TO PA Inc.

ASS Succession or assignment of patent right

Free format text: FORMER OWNER: P CO., LTD. TO PA

Effective date: 20140312

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140312

Address after: Tokyo, Japan, Japan

Patentee after: Global Entertainment Corporation

Address before: Tokyo, Japan, Japan

Patentee before: Global Entertainment Corporation

Patentee before: KK P to PA