WO2002076687A1

WO2002076687A1 - Robot device and control method therefor, and storage medium

Info

Publication number: WO2002076687A1
Application number: PCT/JP2002/002889
Authority: WO
Inventors: Rika Horinaka; Masahiro Fujita; Atsushi Okubo; Kenta Kawamoto; Gabriel Costa; Masaki Fukuchi; Osamu Hanagata; Kotaro Sabe
Original assignee: Sony Corporation
Priority date: 2001-03-27
Filing date: 2002-03-26
Publication date: 2002-10-03
Also published as: US7251606B2; EP1407859A1; JP2002283261A; KR20030007685A; CN1460051A; US20030182122A1

Description

明細書ロボット装置及びその制御方法、並びに記憶媒体 [技術分野] 本発明は、ユーザからの指令や周囲の環境に応じて動作する歩行型のロボット装置、多関節ロボット、あるいはコンピュータ 'グラフィックス（C G)で動作するキャラクタを用いたアニメーションなど（ロボヅト装置等）に関して適用される対話装置及び方法、並びに記憶媒体に係り、特に、文章を生成して発話することによってユーザと会話ベースでコミュニケーションを行うロボット装置及びその制御方法、並びに記憶媒体に関する。

さらに詳しくは、本発明は、ロボット装置等の感情に基づく文章を生成して発話するロボット装置及びその制御方法、並びに記憶媒体に係り、特に、ロボット装置等の内部状態に応じた文章を生成して発話することで内部状態を表現する口ボヅト装置及びその制御方法、並びに記憶媒体に関する。

[背景技術] 従来、ユーザからの指令や周囲の環境に応じて動作する歩行型のロボット装置、多関節ロボット、あるいはコンビユー夕'グラフィヅクス（C G )で動作するキヤラク夕を用いたアニメーションなどに関して、数多の提案がなされ、開発されている。このようなロボット装置あるいはアニメーション（以下では、これらをまとめて「ロボット装置等」とも呼ぶ）は、ユーザからの指令に応答して一連の動作を行う。

例えば、ィヌのような 4足歩行動物に類似された形状'構造のロボット装置、すなわち「ペット ·ロボット」においては、ユーザからの「伏せ」という命令（例えば音声入力）に応答して伏せの姿勢をとつたり、自分の口の前にユーザが手を差し出すと「お手」の動作をしたりする。このようにィヌゃヒトなどの現実の動物を摸したロボット装置等は、できるだけ本物の動物がする動作や感情表現に近いことが望ましい。また、ユーザからの指令や外部環境に基づいてあらかじめ決められた動作を行うだけでなく、本物の動物と同じように自律的に動作することが望ましい。何故ならば、ロボット装置等が現実とはかけ離れた同じ動作を繰り返しているとユーザは飽きてしまい、また、同じ住環境下での人間との共生という、ロボット装置等の開発の究極目的を達成し得ないからである。

最近のインテリジェントなロボット装置等は、音声入出力、音声認識、音声合成などの機能を搭載し、音声ベースでユーザと会話'対話を行うことができる。この会話 ·発生においても、ユーザからの指令や外部環境に基づいて定められた動作を行うだけでなく、本物の動物と同じように自律的に動作することが望まれていところで、従来の会話発声システムとしては、例えば、特開平 1 0— 2 4 7 1 9 4号公報、特開平 8— 3 3 9 4 4 6号公報、特開平 9— 1 6 8 0 0号公報などを挙げることができる。

特開平 1 0— 2 4 7 1 9 4号公報には、既翻訳の誤り発話意図などの違いに対して適切な用例を検索して文全体としての整合性を保って翻訳して音声合成することができる自動通訳装置について開示されている。また、特開平 8— 3 3 9 4 4 6号公報には、ュ一ザの多様な感情を検出し、この感情に応じて、コンビユー夕側から情報を出力することにより、親しみの持てる対話装置について開示されている。また、特開平 9— 1 6 8 0 0号公報には、発話テーマの変更にも容易に対応し得る、実用的で且つユーザとの自然な対話が可能な顔画像付き音声対話システムについて閧示されている。

しかしながら、これら従来の会話発声システムは、基本的には、話者すなわちユーザの音声認識とともに表情からの感情抽出を行い、あくまで話者の話題に沿つて、話者の感情に合わせた文章を生成するものである。

また、特開平 9— 1 6 8 0 0号公報に記載の顔画像付き音声対話システムは、あらかじめ発話に対応する応答内容をテーブルとしてあらかじめ定義しておくシステムであり、その応答内容に感情情報を含んでいるが、これは返事とそのときの感情があらかじめ決められていることに他ならない。

インテリジェントなロボット装置等は、感情などからなる内部状態を備えており、この内部状態を外部に出力することによって、ユーザとより深いレベルでのコミュニケ一シヨンを実現することができる。

しかしながら、いままでのロボット装置等では、内部状態を表現する手段は四肢の動作などに限定されたものしかなく、誰にでも見て分るというものではなかつた。

[発明の開示] 本発明の目的は、ユーザからの指令や周囲の環境に応じて動作する歩行型の口ボット装置、多関節ロボット、あるいはコンビユー夕'グラフィックス（C G)で動作するキャラクタを用いたアニメーションなどのロボット装置等に関して適用することができる、優れたロボット装置及びその制御方法、並びに記憶媒体を提供することにある。

本発明のさらなる目的は、ロボット装置等の感情に基づく文章を生成して発話することができる、優れたロボット装置及びその制御方法、並びに記憶媒体を提供することにある。

本発明のさらなる目的は、ロボット装置等の内部状態に応じた文章を生成して発話することで内部状態を表現することができる、優れたロボット装置及びその制御方法、並びに記憶媒体を提供することにある。本発明は、上記課題を参酌してなされたものであり、その第 1の側面は、ユーザとの対話機能を備えたロボット装置又はその制御方法であって、

外部状態を入力する外部状態入力手段又はステツプと、

内部状態を管理する内部状態管理手段又はステツプと、

内部状態の変化をユーザとの対話に反映させる対話制御手段又はステップと、を具備することを特徴とするロボット装置又はその制御方法である。

本発明の第 1の側面に係るロボット装置又はその制御方法によれば、ロボット装置等は、外部状態を認識するとともに、情動などの内部状態を変化させ、この内部状態の変化を対話に反映させることができる。内部状態は文章に付随して、るものではなく、システムに独立して存在し、さまざまな外部入力とシステムの内部変化から常に変動する。

したがって、ロボット装置等に同じ質問を与えたとしても、そのときの内部状態において応える内容は区々で、答え方も内部状態によって相違する。すなわち、ロボット装置等は言葉を使用した内部状態の表現が可能となる。

この結果、誰でもロボット装置等の内部状態を容易に把握することができ、例えば、ロボットの嗜好を理解したりより深いコミュニケ一シヨンが可能となる。また、人間とロボット装置等との対話の幅が広がったり、親近感が沸き、より感情移入し易く、ロボット装置等を身近に感じることができるようになるので、人間とロボット装置等との共存が容易になる。

また、ロボット装置等はリアルワールドとのイン夕一ラクシヨンによって変化する感情を言葉によって表現することができるので、誰にでも判り易く親しみ易いロボット装置等を設計'製作することが可能となり、ロボット装置等の娯楽性、エンターティンメント性をより強くすることができる。

また、ロボット装置等は、内部状態によって文章を発声させることによって、ユーザからの質問という外部刺激だけでなく、さまざまな内部刺激、若しくは内部状態によって文章を作成することが可能となる。

また、ロボット装置等は、内部状態の変化要因などを文章に反映させるなど、バリエーションも可能である。その他、名詞についての情報以外にも動詞や形容詞について、内部状態を反映させた文章及び内部状態を説明する文章を作成することが可能となる。

また、本発明の第 2の側面は、ユーザとの対話機能を備えたロボット装置又はその制御方法であって、

外部状態を入力する外部状態入力手段又はステップと、

該入力された外部状態を認識する外部状態認識手段又はステツプと、該認識された外部状態の意味内容を文章形式で理解する外部状態理解手段又はステップと、内部状態を管理する内部状態管理手段又はステツプと、

内部状態に照らし合わせて外部状態の認識結果に沿った対話文を生成する対話文生成手段又はステップと、

該生成された対話文を外部出力する出力手段又はステツプと、

を具備することを特徴とするロボット装置又はその制御方法である。

本発明の第 2の側面に係るロボット装置又はその制御方法によれば、ロボット装置等は、外部状態を認識するとともに、情動などの内部状態を変化させ、この内部状態の変化を対話に反映させることができる。内部状態は文章に付随しているものではなく、システムに独立して存在し、さまざまな外部入力とシステムの内部変化から常に変動する。

ここで、内部状態は例えばロボット装置の情動で構成される。そして、前記内部状態管理手段又はステツプは、外部状態の変化に応答して内部状態を変化させる。

また、ロボット装置等は、外部状態をクラス化した結果を内部状態とともに記憶するデータベースを備えていてもよい。このような場合、前記対話文生成手段又はステップは、データベースを用いて対話文を生成することができる。

また、内部状態に照らし合わせて外部状態の認識結果に沿つた機体の動作又は行動を生成する動作'行動生成手段又はステツプと、該生成された機体動作又は行動を実現する機体制御手段又はステップとを備えていてもよい。このような場合、ロボット装置等は、内部状態の変化を、対話だけではなく機体動作を用いて発現することができる。

また、本発明の第 3の側面は、ユーザとの対話を行う対話装置又は対話制御方法であって、

外部状態を入力する外部状態入力手段又はステップと、

内部状態を管理する内部状態管理手段又はステップと、

内部状態の変化をユーザとの対話に反映させる対話制御手段又はステップと、を具備することを特徴とする対話装置又は対話制御方法である。

本発明の第 3の側面に係る対話装置又は対話制御方法によれば、外部状態を認識するとともに、情動などの内部状態を変化させ、この内部状態の変化を対話に反映させることができる。内部状態は文章に付随しているものではなく、システムに独立して存在し、さまざまな外部入力とシステムの内部変化から常に変動すしたがって、ユーザが同じ質問を与えたとしても、そのときの内部状態において応える内容は区々で、答え方も内部状態によって相違し、使用した内部状態の表現が可能となる。

また、本発明の第 4の側面は、ユーザとの対話を行う対話装置又は対話制御方法であって、

外部状態を入力する外部状態入力手段又はステップと、

該入力された外部状態を認識する外部状態認識手段又はステツプと、該認識された外部状態の意味内容を文章形式で理解する外部状態理解手段又はステップと、

内部状態を管理する内部状態管理手段又はステップと、

を具備することを特徴とする対話装置又は対話制御方法である。

本発明の第 4の側面に係る対話装置又は対話制御方法によれば、外部状態を認識するとともに、情動などの内部状態を変化させ、この内部状態の変化を対話に反映させることができる。内部状態は文章に付随しているものではなく、システムに独立して存在し、さまざまな外部入力とシステムの内部変化から常に変動する。

したがって、ユーザが同じ質問を与えたとしても、そのときの内部状態において応える内容は区々で、答え方も内部状態によって相違し、使用した内部状態の表現が可能となる。

ここで、前記内部状態管理手段又はステップは、外部状態の変化に応答して内部状態を変化させるようにしてもよい。

また、対話装置は、外部状態をクラス化した結果を内部状態とともに記憶するデータベースをさらに備えていてもよい。このような場合、前記対話文生成手段又はステップは、デ一夕ベースに記憶された情報を用いて対話文を生成することができる。

また、本発明の第 5の側面は、ユーザとの対話機能を備えたロボット装置の制御をコンビユー夕'システム上で実行するように記述されたコンピュータ ·ソフトウェアをコンピュー夕可読形式で物理的に格納した記憶媒体であって、前記コンピュー夕.ソフトウエアは、

外部状態を入力する外部状態入力ステップと、

該入力された外部状態を認識する外部状態認識ステップと、

該認識された外部状態の意味内容を文章形式で理解する外部状態理解ステツプと、

内部状態を管理する内部状態管理ステップと、

内部状態に照らし合わせて外部状態の認識結果に沿った対話文を生成する対話文生成ステップと、

該生成された対話文を外部出力する出カステツプと、

を具備することを特徴とする記憶媒体である。

また、本発明の第 6の側面は、ユーザとの対話処理をコンビユー夕'システム上で実行するように記述されたコンビユー夕 'ソフトウエアをコンビュ一夕可読形式で物理的に格納した記憶媒体であって、前記コンピュータ 'ソフトウェアは、外部状態を入力する外部状態入力ステップと、

該入力された外部状態を認識する外部状態認識ステツプと、

内部状態を管理する内部状態管理ステツプと、

該生成された対話文を外部出力する出カステツプと、を具備することを特徴とする記憶媒体である。

本発明の第 5並びに第 6の各側面に係る記憶媒体は、例えば、様々なプログラム 'コードを実行可能な汎用コンピュータ 'システムに対して、コンピュータ ·ソフトウェアをコンピュータ可読な形式で提供する媒体である。このような媒体は、例えば、 C D (Compact Disc) や F D (Flexible Disk), M O (Magneto-Optical disc) などの着脱自在で可搬性の記憶媒体である。あるいは、ネットワーク（ネットワークは無線、有線の区別を問わない）などの伝送媒体などを経由してコンピュー夕 ·ソフトウエアを特定のコンピュータ ·システムに提供することも技術的に可能である。

このような記憶媒体は、コンピュータ ·システム上で所定のコンピュータ ·ソフトウエアの機能を実現するための、コンピュータ ·ソフトウエアと記憶媒体との構造上又は機能上の協働的関係を定義したものである。換言すれば、本発明の第 5並びに第 6の各側面に係る記憶媒体を介して所定のコンピュー夕 'ソフトゥエアをコンピュータ 'システムにィンストールすることによって、コンビュ一夕 · システム上では協働的作用が発揮され、本発明の第 2の側面に係るロボット装置及びその制御方法、並びに、本発明の第 4の側面に係る対話装置及び対話制御方法の各々と同様の作用効果を得ることができる。本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。

[図面の簡単な説明] 図 1は、本発明を実施に供される四肢による脚式歩行を行う移動ロボット 1の外観構成を示した図である。

図 2は、移動ロボット 1の動作を制御する制御ュニットのハードウェア構成を模式的に示した図である。

図 3は、コントローラ 3 2の機能構成を模式的に示した図である。

図 4は、信号認識部 4 1の機能構成を模式的に示した図である。図 5は、感情，本能モデル部 4 2の機能構成を模式的に示した図である。

図 6は、本実施形態に係る移動ロボット 1の対話メカニズム 7 0を模式的に示した図である。

図 7は、移動ロボット 1がユーザに尋ねられて答える場合の対話メカニズム 7 0の動作例を示した図である。

図 8は、移動ロボット 1が物を認識して話す場合の対話メカニズム 7 0の動作例を示した図である。

[発明を実施するための最良の形態] 以下、図面を参照しながら本発明の実施形態について詳解する。図 1には、本発明を実施に供される、四肢による脚式歩行を行う移動ロボット 1の外観構成を示している。図示の通り、該ロボット 1は、四肢を有する動物の形状や構造をモデルにして構成された多関節型の移動ロボットである。とりわけ本実施例の移動ロボット 1は、愛玩動物の代表例であるィヌの形状及び構造を模してデザインされたぺット型ロボットという側面を有し、例えば人間の住環境において人間と共存するとともに、ユーザ操作に応答した動作表現することができる o

移動ロボット 1は、胴体部ユニット 2と、頭部ユニット 3と、尻尾 4と、四肢すなわち脚部ュニット 6 A〜 6 Dで構成される。

胴体部ュニット 2には、機体動作を統括的にコントロールする制御ュニット（後述：図 1には図示せず）や、機体の主電源であるバッテリ 2 1 (図 1には図示しない）が収容されている。

頭部ユニット 3は、ロール、ピッチ及びョ一の各軸方向（図示）の自由度を持つ首関節 7を介して、胴体部ユニット 2の略前上端に配設されている。また、頭部ユニット 3には、ィヌの「目」に相当する C C D (Charge Coupled Device：電荷結合素子）カメラなどの画像認識部 1 5と、「耳」に相当するマイクロフォン 1 6と、「口 Iに相当するスピーカ 1 Ίと、触感に相当する夕ツチセンサ 1 8と、複数の L E Dィンジケ一夕 1 9と、ユーザからリモート'コントローラ（図示しない）を介して送信される指令を受信するリモート'コントローラ受信部 2 0が搭載されている。これら以外にも、生体の五感を構成するセンサを含んでいても構わない。

尻尾 4は、ロール及びピッチ軸の自由度を持つ尻尾関節 8を介して、胴体部ュニット 2の略後上端に湾曲若しくは揺動自在に取り付けられている。

脚部ュニット 6 A及び 6 Bは前足を構成し、脚部ュニット 6 C及び 6 Dは後足を構成する。各脚部ユニット 6 A〜6 Dは、それそれ、大腿部ユニット 9 A〜9 D及び脛部ュニット 1 0 A〜1 0 Dの組み合わせで構成され、胴体部ュニット 2 の底面の前後左右の各隅部に取り付けられている。大腿部ュニット 9 A〜9 Dは、ロール、ピッチ、ョ一の各軸の自由度を持つ股関節 1 1 A〜1 I Dによって、胴体部ユニット 2の各々の所定部位に連結されている。また、大腿部ユニット 9 A 〜9 Dと脛部ュニット 1 0 A〜l 0 Dの間は、ロール及びピッチ軸の自由度を持つ膝関節 1 2 A〜l 2 Dによって連結されている。

図示のように構成された脚式移動ロボット 1は、後述する制御部からの指令により各関節ァクチユエ一夕を駆動することによって、例えば、頭部ユニット 3を上下左右に振らせたり、尻尾 4を振らせたり、各足部ユニット 6 A〜 6 Dを同期協調的に駆動させて歩行や走行などの動作を実現することができる。

なお、移動ロボット 1の関節自由度は、実際には各軸毎に配備され関節ァクチユエ一夕（図示しない）の回転駆動によって提供される。また、脚式移動ロボット 1が持つ関節自由度の個数は任意であり、本発明の要旨を限定するものではない o

図 2には、この移動ロボット 1の動作を制御する制御ュニッ卜のハードウェア構成を模式的に示している。

頭部 3は、マイク 1 6及びリモート 'コントローラ受信部 2 0からなるコマンド受信部 3 0と、画像認識部 1 5及び夕ツチ'センサ 1 8からなる外部センサ 3 1と、スピーカ 1 7と、 L E Dインジケ一夕 1 9とを有している。

また、胴体部 2は、主電源としてのバヅテリ 2 1を収容するとともに、移動口ボヅト 1全体の動作を統括的にコントロールするコントローラ 3 2と、ノッテリ 2 1の残存容量を検出するためのバッテリ'センサ 3 3と、機体内部で発生する熱を検出するための熱センサ 3 4からなる内部センサ 3 5とを備えている。

さらに、移動ロボット 1の各部（例えば駆動関節部分）には、複数のァクチュエー夕 2 3 A〜 2 3 Nがそれそれ配設されている。

コマンド受信部 3 0は、リモート 'コントローラ受信部 2 0やマイク 1 6などで構成され、ユーザが移動ロボット 1に与える指令、例えば「歩け」、「伏せ」、「ボールを追いかけろ」などの指令を受信することができる。

リモート 'コントローラ受信部 2 0は、ユーザ操作によりリモート 'コント口一ラ（図示しない）に入力された指令を受信して、受信信号 S 1 Aを生成して、こをコントローラ 3 2に送出する。例えば、リモート'コントローラからの指令は、赤外線デ一夕通信（I r D A) や、 B l u e t o o t h、 I E E E 8 0 2 . 1 1 bなどの近距離無線データ通信などの技術を用いて転送される。

マイクロフォン 1 6は、ユーザが所望の指令に応じた音声を発すると、これを集音して音声信号 S 1 Bを生成して、コントローラ 3 2に送出する。

外部センサ 3 1の夕ツチ ·センサ 1 8は、ユーザから移動ロボット 1への働きかけ、例えば「なでる」、「たたく」などの働きかけを検出する。例えば、ユーザにより夕ツチ'センサ 1 8が触れられて所望の働きかけがなされると、これに応じた接触検出信号 S 2 Aを生成して、コントローラ 3 2に送出する。

外部センサ 3 1の画像認識部 1 5は、移動ロボット 1の周囲の環境を識別した結果、例えば「暗い」、「お気に入りのォモチヤがある」などの周囲の環境情報を検出したり、あるいは、「他のロボッ卜が走っている」などの他の移動ロボッ卜の動きを検出したりする。この画像認識部 1 5は、周囲の画像を撮影した結果得られる画像信号 S 2 Bをコントローラ 3 2に送出する。

内部センサ 3 5は、移動ロボット 1自身の内部状態、例えば、バッテリの残存容量が低下したことを意味する「お腹が空いた」、「熱がある」などの内部状態を検出するためのものであり、バッテリ 'センサ 3 3と熱センサ 3 4を含んでいる。バッテリ.センサ 3 3は、機体の主電源であるバッテリ 2 1の残存容量を検出して、その結果であるバッテリ容量検出信号 S 3 Aをコントローラ 3 2に送出する。また、熱センサ 3 4は、機体内部の熱を検出して、その結果である熱検出信号 S 3 Bをコントローラ 3 2に送出する。

コントローラ 3 2は、コマンド受信部 3 0から供給される指令信号 S 1と、外部センサ 3 1から供給される外部情報信号 S 2と、内部センサ 3 5から供給される内部情報信号 S 3に基づいて、各ァクチユエ一夕 2 3 A〜 2 3 Nを駆動させるための制御信号 S 5 A〜S 5 Nを生成して、これらをそれそれのァクチユエ一夕 2 3 A〜2 3 Nに向けて送出することによって、機体の動作を統括的にコント口ールする。

その際、コントローラ 3 2は、外部に出力するための音声信号 S 1 0や発光信号 S 1 1を必要に応じて生成する。このうち音声信号 S 1 0を、スピーカ 1 7を介して外部に出力し、また、発光信号 S 1 1を L E Dインジケータ 1 9に送出して、所望の発光出力（例えば、点滅したり色を変化させたりする）を行うことにより、ユーザに機体の内部状態などの情報をフィードバックすることができる。例えば、発光出力により、ユーザに自己の感情を知らせるようにすることができる。なお、 L E Dインジケータ 1 9に替えて、画像を表示する画像表示部（図示しない）を備えるようにしてもよい。これにより、所望の画像表示を介して、ュ —ザに自己の感情などの情報をより正確且つ詳細にユーザに提示することができ。

次いで、コントローラ 3 2による機体の制御について説明する。

図 3には、コントローラ 3 2の機能構成を模式的に図解している。同図に示すように、コントローラ 3 2は、信号認識部 4 1と、感情 ·本能モデル部 4 2と、行動決定機構部 4 3と、姿勢遷移機構部 4 4と、制御機構部 4 5という各機能モジユールで構成される。これらの機能モジュールは、実際には、所定のプログラム' コードを実行するという、コンピュータ上でのソフトウエア処理により実現することができる。

信号認識部 4 1では、内部状態並びに外部環境を示す各入力信号を認識'理解する処理が行われる。図 4には、信号認識部 4 1の機能構成を模式的に示している。以下、この図を参照しながら、信号認識部 4 1の機能について説明する。

夕ツチ ·センサ 1 8は、例えば移動ロボット 1の全身に分散して配置された接触センサゃ感圧センサで構成される。例えば、ユーザが移動ロボット 1に対して「なでる」や「叩く」などの外力を印加したときには、そのセンサ入力信号 S 2 Aが意味変換部 5 2に供給される。意味変換処理部 5 1では、「なでる」や「叩く」などのユーザ操作が包含する意味内容を解釈又は推定して、テキスト形式の意味変換データとして言語処理部 5 6に出力する。

画像認識部 1 5は、例えば C C D (Charge Coupled Device) などの撮像装置で構成されている。例えば、ユーザの動作 '挙動（ジエスチヤなど）を捕捉した画像入力信号 S 2 Bは、意味変換処理部 5 2に供給される。意味変換処理部 5 6では、ユーザの動作 '挙動が包含する意味内容を解釈又は推定して、テキスト形式の意味変換データとして言語処理部 5 6に出力する。また、言語形式の意味があらかじめ定義されている視認性識別情報（例えば「サイバーコ一ド」やランドマ —クなど）を画像入力する場合には、画像認識結果と一義の意味変換処理を行うことができる。

マイクロフォン 1 6からの音声入力信号 S 1 Bは、頭部に搭載されている。音声認識処理部 5 3は、音声入力部 5 3を介して入力されるユーザの音声をテキストとして認識されて、言語処理部 5 6に出力する。

ノツテリ ·センサ 3 3は、機体の主電源であるバッテリ 2 1の残存容量を検出して、その結果であるバッテリ容量検出信号 S 3 Aは、意味変換処理部 5 4に供給される。意味変換処理部 5 4では、「お腹が空いた」などのバッテリ 2 1の残存容量が包含する意味内容を解釈又は推定して、テキスト形式の意味変換データとして言語処理部 5 6に出力する。

熱センサ 3 4は、機体内部の熱を検出して、その結果である熱検出信号 S 3 B は、意味変換処理部 5 5に供給される。意味変換処理部 5 5では、「熱がある」などの機体の熱が包含する意味内容を解釈又は推定して、テキスト形式の意味変換データとして言語処理部 5 6に出力する。

言語処理部 5 6は、言語データベース 5 7を利用しながら、外部センサ 3 1や内部センサ 3 5などからの入力結果が持つ意味'内容を解析して、言語すなわち文章形式で理解する。また、言語処理部 5 6は、外部センサ 3 1や内部センサ 3 5 からの入力情報の認識結果を、文章形式又は他の形式で、感情'本能モデル部 4 2 に送出する。言語データベース 5 7は、移動ロボット 1において認識又は発現することのできる事柄をデ一夕ベース化して蓄積している。本実施形態では、言語デ一夕べ一ス 5 7は、後述するように、外部状態をクラス化した結果を、情動とともにデー夕ベース管理している。言語データベース 5 7の記憶内容は、経験や学習により変更する。

言語処理部 5 6では、移動ロボット 1の中でのその事柄についての快不快とその意味合いも、言語データベース 5 7を照合することで処理する。また、それらの事柄と意味合いによって分解した言葉とを照らし合わせ、文の内容に沿った文章を作成する。作成された文章は、例えば、スピーカ 1 7のような出力装置を介して表出される。

再び図 3に戻って、コントローラ 3 2による制御について説明する。感情'本能モデル部 4 2は、移動ロボット 1における内部状態を構成する感情や本能をモデル化して取り扱い、信号認識部 4 1を介して得られる機体内外での環境変化に基づいて感情モデルや本能モデルに変化を与える。

行動決定機構部 4 3は、指令信号 S 1、外部情報信号 S 2、及び、内部情報信号 S 3に加えて、感情'本能モデル部 4 2により得られた感情'本能状態情報 S 1 0に基づいて、移動ロボヅト 1が実行する次の動作（行動）を決定する。

姿勢遷移機構部 4 4は、行動決定機構部 4 3により決定された次の動作（行動）に遷移するための姿勢の遷移計画を立てる。なお、行動決定機構部 4 3により決定された動作（行動）に関する情報は、感情'本能モデル部 4 2にフィードバックされて、感情'本能モデル部 4 2では、決定された動作（行動）を参照して感情や本能の状態を決定することができる。

制御機構部 4 5は、姿勢遷移機構部 4 4から姿勢遷移計画に基づいて送られてくる姿勢遷移情報 S 1 8に基づいて、ァクチユエ一夕 2 3 A〜2 3 Nなどの各駆動部の動作を制御して、実際に姿勢を遷移させてから、行動決定機構部 4 3にて決定された次の動作（行動）を実行させる。

図 5には、感情'本能モデル部 4 2の機能構成を模式的に示している。同図に示すように、感情'本能モデル部 4 2は、感情モデル（Emotion) を構成する情動群 6 0と、感情モデルとは属性の異なるモデルとして用意された本能モデル (Instinct) を構成する欲求群 6 1に大別される。

ここで、感情モデルはある値を有する感情パラメ一夕によって構成され、移動ロボット 1に規定された感情を感情パラメ一夕の値に応じた動作を表出させるためのモデルである。感情パラメ一夕は、主に、圧力センサや視覚センサなどのセンサによって検出された「叩かれた」、「怒られた」といった外部入力信号（外的要因）に基づいて値が上下変動する。勿論、感情パラメ一夕は、バッテリ残存容量や体内温度などの内部入力信号（内的要因）に基づいても変化する。

また、本能モデルは、ある値を有する本能パラメ一夕によって構成され、移動ロボット 1に規定された本能（欲求）を本能パラメ一夕の値に応じた動作を介して表出させるためのモデルである。本能パラメ一夕は、主に、行動履歴に基づいた「運動がしたい」、あるいは、バッテリ残存容量に基づく「充電がしたい（お腹が空いた）」といった内部入力信号に基づいて値が上下変動する。勿論、本能パラメ一夕も、感情パラメ一夕と同様、外部入力信号（外的要因）に基づいても変ィ匕する。

これら感情モデル及び本能モデルは、それそれ同一属性とされる複数種類のモデルによって構成されている。すなわち、情動群 6 0が同一属性からなる独立した感情モデルとしての情動ュニット 6 0 A〜6 O Fを有し、欲求群 6 1が同一属性からなる独立した欲求モデルとしての欲求ユニット 6 1 A~ 6 1 Dを有している。

情動群 6 0としては、「うれしさ」の感情を示す情動ユニット 6 0 A、「悲しさ」の感情を示す情動ュニット 6 0 B、「怒り」の感情を示す情動ュニット 6 0 C、「驚き」の感情を示す情動ュニット 6 0 D、「恐れ」の感情を示す情動ュニット 6 0 E、並びに「嫌悪」の感情を示す情動ュニット 6 0 Fなどが挙げられる。また、欲求群 6 1としては、「運動欲（Movement Instinct)jの欲求を示す欲求ュニット 6 1 As 「愛情欲（Love Instinct)j の欲求を示す欲求ュニット 6 1 B、「食欲 (Recharge Instinct )j の欲求を示す欲求ュニット 6 1 C、「好奇心（Search Instinct)j の欲求を示す欲求ュニット 6 1 Dなどが挙げられる。

情動ュニット 6 0 A〜6 0 Fは、情動の度合いを例えば 0〜1 0 0レベルまでの強度（感情パラメ一夕値）によってそれそれ表し、供給される指令信号 S l、外部情報信号 S 2、及び内部情報信号 S 3に基づいて情動の強度をそれそれ時々刻々と変化させる。かくして、感情 ·本能モデル 4 2は、時々刻々と変化する情動ユニット 6 0 A〜 6 O Fの強度を組み合わせることにより、移動ロボット 1の感情の状態を表現し、感情の時間変化をモデル化している。

さらに、所望の情動ュニットどうしが相互に影響し合って強度が変化するようにもなされている。例えば、情動ユニットどうしを相互抑制的又は相互刺激的に結合し、相互に影響し合って強度が変化するようにしている。

本実施形態に係る移動ロボット 1は、外部状態を文章ベースで認識するとともに、内部状態を基に情動を発生させて、情動の変化をユーザとの対話に反映させることができる。ここで言う内部状態は、文章に付随しているものではなく、システムに独立して存在し、さまざまな外部入力とシステムの内部変化から常に変動する。すなちわ、移動ロボット 1は、自身の内部状態によって文章を発声するなどの表出動作を行なうので、ユーザからの質問という外部刺激だけでなく、さまざまな内部刺激や内部状態によって文章を作成し、ユーザとの対話という形態で表出することができる。したがって、ロボット装置等に同じ質問を与えたとしても、その時々における内部状態において応える内容は区々で、答え方も内部状態によって相違する。

図 6には、本実施形態に係る移動ロボット 1上で提供される対話メカニズム 7

0を模式的に示している。同図に示すように、この対話メカニズム 7 0は、認識オブジェクト 7 1と、理解オブジェクト 7 2と、言語デ一夕ペース 5 7と、内部状態オブジェクト 7 3と、生成オブジェクト 7 4と、実行オブジェクト 7 5とで構成される。

認識オブジェクト 7 1は、マイクロフォン 1 6や夕ツチ ·センサ 1 8などのハ —ドウヱァからの入力を認識し得る形でシステム内に取り込む。

理解オブジェクト 7 2は、認識ォブジェクト 7 1によって取り込まれた形に対して、意味を与える。例えば、圧力 8 0に対して" H I T"という意味を与えたり、角が 3つに対して「三角形」という意味を与える。

理解オブジェクト 7 2は、言語データベース 5 7を参照して、認識'発現できる事柄をここから探索する。言語デ一夕ベース 5 7は、移動ロボット 1において認識又は発現することのできる事柄をデ一夕ベース化して蓄積している。言語デ一夕ベース 5 7は、より好ましくは、外部状態をクラス化した結果を情動とともにデータべ—ス管理している。移動ロボット 1の中でのその事柄についての快不快とその意味合いも、言語データベース 5 7を参照することによって処理される。言語デ一夕ベース 5 7は、経験や学習により変更する。言語データベース 5 7は、文章テンプレートも備え、それらの事柄と意味合いによって分解した言葉とを照らし合わせ、文の内容に沿った文章を作成することができる。

認識オブジェクト 7 1と、理解オブジェクト 7 2と、言語デ一夕ペース 5 7は、信号認識部 4 1 (図 3を参照のこと）内で構成される。

内部状態オブジェクト 7 3は、例えば、本能'感情モデル部 4 2 (図 3を参照のこと）によって構成され、理解オブジェクトによって付けられた意味合いに基づいて移動ロボット 1の内部状態を変化させる。

生成オブジェクト 7 4は、行動決定機構部 4 3 (図 3を参照のこと）によって構成され、理解オブジェクト 7 2並びに内部状態オブジェクト 7 3の出力に基づいて、移動ロボット 1の次の動作（行動）を決定する。本実施形態では、生成ォブジェクト 7 4は、機体動作で発現する行動、並びに文章という形式で次の動作を生成する。

実行オブジェクト 7 5は、生成オブジェクト 7 4により生成されたォブジェクトを実行して外部出力する。生成されたオブジェク卜が行動であった場合には、ァクチユエ一夕 2 3 A〜2 3 Nの駆動による機体動作によって実行される。また、生成されたオブジェク卜が文章であった場合には、スピーカ 1 7を介した発声によって実行される。実行オブジェクトは、姿勢遷移機構部 4 4と制御機構部 4 5 (図 3を参照のこと）によって構成される。

また、実行オブジェクト 7 5による外部出力の実行結果は、内部状態オブジェクト 7 3にフィードバックされ、内部状態を変化させる。

次いで、移動ロボット 1の対話メカニズム 7 0の動作例について説明する。図 7には、移動ロボット 1がユーザに尋ねられて答える場合の対話メカニズム 7 0の動作例を示している。

移動ロボヅト 1は、認識'発現できるもののデータベースを備えている。ユーザが移動ロボット 1に対して、「ボールは好きですか？」と尋ねると、移動ロボット 1は、その人間の言葉をマイクロフォン 1 6で集音して、認識オブジェクト 7 1 において H MM (Hidden Markov Model：隠れマルコフ 'モデル）などにより音声認識し、その意味合いにより文章を分解する（隠れマルコフ 'モデルは、音素や単語などの音声の単位を統計的にモデル化したもので、状態遷移構造を持う)。さらに、理解オブジェクト 7 2により、音声入力された文章が疑問文であること、並びに、主語（S )、述語（V)、及びこの文章が Sに対しての嗜好の疑問であることを判別する。

ここで、データベース 5 7から「ボール」を引き出して、「ボール」は快が高い、すなわち「好き」な物だと判断する。よって、生成オブジェクト 7 4では、「Sは Vですか？」という質問に対する答え「Sは V」、つまり「ボールは好き」という文章を作成する。そして、実行オブジェクト 7 5において、生成された文章の発音列を作成してその波形を生成して、スピーカ 1 7から発生することによって、嗜好に対する受け答えが実現される。

「なぜボールが好きなのですか？」という入力があった場合も同様に、認識ォブジェクト 7 1において分割された文章に基づき、理解オブジェクト 7 2により入力された文章が疑問文であること、主語（S )、述語（V)、この文章が Sが V であることの理由の疑問であることを判別する。

ここで、データベース 5 7から「ボール」を引き出し、その快不快が決定した要因「蹴れる」を取り出す。そして、「Sは〇〇だから V」という理由を示す文章に対して、生成オブジェクト 7 4は「ボールは蹴れるから好き」というような答えの文章を生成する。そして、実行オブジェクト 7 5において生成された文章の発音列を作成してその波形を生成して、スピーカ 1 7から発生することによって嗜好の理由に対する受け答えが実現される。

主語 Sの部分には、名詞だけでなく、動詞を名詞化したもの（「遊ぶこと」など）や形容詞を名詞化したもの（「きれいなもの」、「たのしいこと」など）などを使用することによって、文章表現の幅が拡張される。

また、ユーザがボールを指差しながら、「これは好きですか？」と質問した場合には、認識オブジェクト 7 1によって入力された文章を分割した後、理解ォブジェクト 7 2では、この文章の Sに当る「これ」が指示代名詞であることを理解する。そこで、移動ロボット 1は、ユーザが指差しているものが何であるかを画像入力を基に判別して、「これ」と「ボール」を結び付ける。このように指示代名詞を特定の物と結び付けた上で、上述と同じ処理を実行すればよい。

また、図 8には、移動ロボット 1がカメラで対象物を認識した場合の対話メカニズム 7 0の動作例を示している。

例えば、ボールのように認識可能な物を移動ロボット 1の視界に置いた場合、移動ロボット 1は、カメラ 1 5によってその物体の画像を取り込む。そして、認識ォブジェクト 7 1によって取り込んだ画像がボールであることを判別する。理解オブジェクト 7 2は、データベース 5 7を参照して「ボール」を引き出し、「ボール」は快が高い、つまり「好き」な物だと判断する。

これに応答して、生成オブジェクト 7 4では、「Sは V」、つまり「ボールは好き」という文章を作成する。そして、実行オブジェクト 7 5において、生成された文章の発音列を作成してその波形を生成して、スピーカ 1 7から発生することによって、移動ロボット 1自身の嗜好表現が実現される。

最後に、本実施形態に係る対話メカニズム 7 0を適用して生成される文章例を以下に示しておく。

( 1 ) 名前の判らない物を見て、「これは何ですか？」と質問する

( 2 ) 名前の分かる物を見て、「これは〇〇です」と言う。

( 3 ) 自分の本能モデル（Instinct)、感情モデル（Emotion) のパラメ一夕値を基に、「〇〇が X Xだ」と伝える。

例）食欲（Hunger.) が高くなつて、「お腹が減った」と言う。

例）うれしさ（Joy) が高くなつて、「私はうれしい」と伝える。

( 4 ) 自分の本能、感情を満足させるものを「（〇〇を） X Xしたい」と伝える。例）運動欲（Exercise) を満足させるために「ボールを蹴りたい」と伝える。例）食欲（Thirst) を満足させるために「水を飲みたい」と伝える。

( 5 ) 「〇〇しなさい」と人間から言われたことに対して、命令文だと理解して、「〇〇します」と答える。追補

以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施例の修正や代用を成し得ることは自明である。

本明細書では、ぺット'ロボットに対して本発明を適用した実施形態を主として説明してきたが、本発明の要旨は、必ずしも「ロボット」と称される製品には限定されない。すなわち、電気的若しくは磁気的な作用を用いて人間の動作に似せた運動を行う機械装置であるならば、例えば玩具等のような他の産業分野に属する製品であっても、同様に本発明を適用することができる。また、勿論、コンビユー夕 ·グラフィヅクス（C G )で動作するキャラクタを用いたアニメ一シヨンなどに対しても本発明を適用することができる。

要するに、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。

[産業上の利用可能性] 本発明によれば、ユーザからの指令や周囲の環境に応じて動作する歩行型の口ボット装置、多関節ロボット、あるいはコンピュータ 'グラフィックス（C G)で動作するキャラクタを用いたアニメーションなどのロボット装置等に関して適用することができる、優れたロボット装置及びその制御方法、並びに記憶媒体を提供することができる。

また、本発明によれば、ロボット装置等の内部状態に応じた文章を生成して発話することで内部状態を表現することができる、優れたロボット装置及びその制御方法、並びに記憶媒体を提供することができる。

本発明に係るロボット装置及びその制御方法によれば、ロボット装置等は言葉を使用した内部状態の表現が可能となる。この結果、誰でもロボット装置等の内部状態を容易に把握することができ、例えば、ロボットの嗜好を理解したりより深いコミュニケーションが可能となる。また、人間とロボット装置等との対話の幅が広がったり、親近感が沸き、より感情移入し易く、ロボット装置等を身近に感じることができるようになるので、人間とロボット装置等との共存が容易になる。

また、本発明に係るロボット装置及びその制御方法によれば、ロボット装置等はリアルワールドとのィン夕ーラクシヨンによって変化する感情を言葉によって表現することができるので、誰にでも判り易く親しみ易いロボット装置等を設計' 製作することが可能となり、ロボット装置等の娯楽性、エンターテインメント性をより強くすることができる。

本発明に係るロボット装置及びその制御方法では、内部状態（感情は内部状態の一部とみなす）は文章に付随しているものではなく、システムに独立して存在し、さまざまな外部入力とシステムの内部変化から常に変動するものである。したがって、ロボット装置等に同じ質問を与えたとしても、そのときの内部状態において応える内容は区々であり、答え方もロボット装置等の内部状態によって相違する。内部状態は文章によるものではなく、内部状態によって文章を作成する、という点に充分留意されたい。

また、本発明に係るロボット装置及びその制御方法では、内部状態によって文章を発声させることによって、ユーザからの質問という外部刺激だけでなく、さまざまな内部刺激、若しくは内部状態によって文章を作成することが可能である。また、内部状態の変化要因などを文章に反映させるなど、バリエーションも可能である。その他、名詞についての情報以外にも動詞や形容詞について、内部状態を反映させた文章及び内部状態を説明する文章を作成することが可能である。

Claims

請求の範囲

1 . ユーザとの対話機能を備えたロボット装置であって、

外部状態を入力する外部状態入力手段と、

内部状態を管理する内部状態管理手段と、

内部状態の変化をユーザとの対話に反映させる対話制御手段と、

を具備することを特徴とするロボット装置。

2 . ユーザとの対話機能を備えたロボット装置であって、

外部状態を入力する外部状態入力手段と、

該入力された外部状態を認識する外部状態認識手段と、

該認識された外部状態の意味内容を文章形式で理解する外部状態理解手段と、内部状態を管理する内部状態管理手段と、

内部状態に照らし合わせて外部状態の認識結果に沿った対話文を生成する対話文生成手段と、

該生成された対話文を外部出力する出力手段と、

を具備することを特徴とするロボット装置。

3 . 内部状態は前記ロボット装置の情動で構成される、

ことを特徴とする請求項 2に記載のロボット装置。

4 .前記内部状態管理手段は、外部状態の変化に応答して内部状態を変化させる、ことを特徴とする請求項 2に記載のロボット装置。

5 . 外部状態をクラス化した結果を内部状態とともに記憶する記憶手段をさらに備え、

前記対話文生成手段は、前記記憶手段に記憶された情報を用いて対話文を生成する、

ことを特徴とする請求項 2に記載のロボット装置。

6 . 内部状態に照らし合わせて外部状態の認識結果に沿った機体の動作又は行動を生成する動作 ·行動生成手段と、

該生成された機体動作又は行動を実現する機体制御手段と、

をさらに備えることを特徴とする請求項 2に記載のロボット装置。

7 . ユーザとの対話機能を備えたロボヅト装置の制御方法であって、

外部状態を入力する外部状態入力ステップと、

内部状態を管理する内部状態管理ステップと、

内部状態の変化をユーザとの対話に反映させる対話制御ステップと、を具備することを特徴とするロボット装置の制御方法。

8 . ユーザとの対話機能を備えたロボット装置の制御方法であって、

外部状態を入力する外部状態入力ステップと、

内部状態を管理する内部状態管理ステップと、

該生成された対話文を外部出力する出カステツプと、

を具備することを特徴とするロポット装置の制御方法。

9 . 内部状態は前記ロボット装置の情動で構成される、

ことを特徴とする請求項 8に記載のロボット装置の制御方法。

1 0 . 前記内部状態管理ステップでは、外部状態の変化に応答して内部状態を変化させる、

1 1 . 前記対話文生成ステップでは、外部状態をクラス化した結果を内部状態とともに記憶するデータベースを用いて対話文を生成する、

1 2 . 内部状態に照らし合わせて外部状態の認識結果に沿った機体の動作又は行動を生成する動作'行動生成ステップと、

該生成された機体動作又は行動を実現する機体制御ステップと、

をさらに備えることを特徴とする請求項 8に記載のロボット装置の制御方法。

1 3 . ユーザとの対話を行う対話装置であって、

外部状態を入力する外部状態入力手段と、

内部状態を管理する内部状態管理手段と、

を具備することを特徴とする対話装置。

1 4 . ユーザとの対話を行う対話装置であって、

外部状態を入力する外部状態入力手段と、

該入力された外部状態を認識する外部状態認識手段と、

該生成された対話文を外部出力する出力手段と、

を具備することを特徴とする対話装置。

1 5 . 前記内部状態管理手段は、外部状態の変化に応答して内部状態を変化させる、

ことを特徴とする請求項 1 4に記載の対話装置。

1 6 . 外部状態をクラス化した結果を内部状態とともに記憶する記憶手段をさらに備え、

ことを特徴とする請求項 1 4に記載の対話装置。

1 7 . ユーザとの対話を行う対話制御方法であって、

外部状態を入力する外部状態入カステツプと、

内部状態を管理する内部状態管理ステツプと、

内部状態の変化をユーザとの対話に反映させる対話制御ステップと、を具備することを特徴とする対話制御方法。

1 8 . ユーザとの対話を行う対話制御方法であって、

外部状態を入力する外部状態入カステツプと、

該認識された外部状態の意味内容を文章形式で理解する外部状態理解ステップと、

内部状態を管理する内部状態管理ステツプと、

該生成された対話文を外部出力する出カステツプと、

を具備することを特徴とする対話制御方法。

1 9 . 前記内部状態管理ステップでは、外部状態の変化に応答して内部状態を変化させる、

ことを特徴とする請求項 1 8に記載の対話制御方法。

2 0 . 前記対話文生成手段は、外部状態をクラス化した結果を内部状態とともに記憶するデータベースを用いて対話文を生成する、ことを特徴とする請求項 1 8に記載の対話制御方法。

2 1 .ユーザとの対話機能を備えたロボット装置の制御をコンピュータ 'システム上で実行するように記述されたコンピュータ'ソフトウエアをコンピュータ可読形式で物理的に格納した記憶媒体であって、前記コンピュータ'ソフトウエアは、外部状態を入力する外部状態入カステツプと、

内部状態を管理する内部状態管理ステップと、

該生成された対話文を外部出力する出力ステップと、

を具備することを特徴とする記憶媒体。

2 2 .ュ一ザとの対話処理をコンビユー夕'システム上で実行するように記述されたコンビユー夕'ソフトウヱァをコンピュータ可読形式で物理的に格納した記憶媒体であって、前記コンピュータ 'ソフトウェアは、

外部状態を入力する外部状態入カステツプと、

内部状態を管理する内部状態管理ステップと、

該生成された対話文を外部出力する出力ステップと、

を具備することを特徴とする記憶媒体。