WO2000016259A1

WO2000016259A1 - Dispositif visuel

Info

Publication number: WO2000016259A1
Application number: PCT/JP1999/004975
Authority: WO
Inventors: Yoshiaki Ajioka
Original assignee: Ecchandes Inc.
Priority date: 1998-09-10
Filing date: 1999-09-10
Publication date: 2000-03-23
Also published as: KR100402361B1; AU763178B2; DE69935437D1; IL141589A0; IL141589A; US6856696B1; EP1113388B1; CN1292383C; EP1113388A4; KR20010085779A; DE69935437T2; EP1113388A1; AU5650099A; CN1317124A; JP4324327B2

Description

明細書視覚装置技術分野

本発明は、画像中の物体の数を数える視覚装置及びその方法に関し、詳しくは、ビデオカメラやデジタルカメラなどで撮影された三原色波長、可視光波長、赤外線波長、紫外線波長、その他全ての電磁波のうち任意の帯域から構成される画像中の移動物体又は静止物体の数を数えるものに関する。背景技術

従来からビデオカメラやデジタルカメラを用いて複数の物体を 1つの画面に収まるように撮影し、デジタル技術を用いて画面中の物体の数を数える装置が開発されてきた。代表的な例としては、顕微鏡を介して撮影された細胞の数を数える装置が挙げられる。細胞の染色体は紫色に染色されるので、画像中ある一定以上の大きさの紫色の領域を切り出して 1つの塊にすることで、細胞の数を数えることができる。しかしながら細胞を染色しては困る場合や染色できない場合において、細胞の数を数えることは容易ではない。というのも一般的に細胞は透明であるので、細胞全体を 1つの塊にするために色情報はあまり役に立たない。勿論細胞の画像を拡大すれば核やミトコンドリアの陰影を捉えることができるが、このような場合はむしろ例外である。そのため光の屈折、反射により映し出される細胞の輪郭からエッジ情報を生成する場合が多い。このエッジ情報を用いれば理論上細胞全体を 1つの塊にできるはずであるが、実際にはエッジ情報が不完全である場合が殆どなので、細胞の形や大きさといった情報を用いてエッジ情報を補完している。しかもこのエッジ情報から細胞全体を 1つの塊にするためには、塗り潰しなど計算量の多い画像処理を施す必要があり、当然のことながらエッジ情報に切れ目があってはいけない。その上細胞の中から移動している細胞だけを選び切り出すとなるとオプティカルフローなどの計算を行わざるを得ず、結局計数の精度を上げるためには高額の装置が必要となり、一方で安い装置を使うと、計算時間が膨大になる。

ところで細胞など一部の例外を除いて一般的な物体には色がある。例えばおおざっぱに言って、おたまじゃくしの背中はこげ茶色であり、りんごは赤色、黄色、緑色であり、馬は黒色、茶色、灰色であり、カラスは黒色である。したがってこのような物体を数えるためには画像中から物体固有の色情報を見つけ出せば良さそうだが、事はそう簡単ではなレ^ 一つには、色情報は太陽光や照明の明るさ、及びカメラの性能により大きく左右されてしまう。また類似色の物体が撮影環境にあると、対象物体とそれ以外を区別をすることが難しい。そこで形や大きさなどの情報を用いて背景から対象物体を切り出してから、その物体の数を数える方が一般的であり、色情報は対象物体を絞り込んで計算量を低減するために用いられる程度である。もし視覚装置が色情報の変化を物体の動きとして捉えれば照明や力メラの性能はあまり問題ではなくなるが、物体の動きから物体の形を正確に再現することが難しくなるばかり力エツジ情報で囲まれた領域を塗り潰すことにより物体領域を確定しなければならないといった問題が生じてしまい、色情報の変化を活用した視覚装置は十分に研究されてこなかった。

これらのことを考慮すると、視覚装置が色情報の変化などから物体の動きを捉えてェッジ情報を生成し、このエッジ情報から物体を切り出して 1つの塊にすることができれば、物体の特徴や撮影環境に依存することなく物体の数を数えることができるようになる。しかも物体自体を振動させるか、カメラを振動させるか、さもなくば撮影された画像を振動させることにより色情報からエツジ情報を生成することができれば、物体が静止しているとしても視覚装置は物体の数を数えることができるものと期待される。

さてここで、カメラが撮影した物体の数を数えることができる前述の視覚装置があるものとする。もしカメラが撮影した物体が静止していれば、視覚装置は常時静止物体の数を数えることができる。しかしながらもし物体が移動していれば、カメラが移動物体を撮影している間しか視覚装置は移動物体の数を数えることができない。シャーレの中の細胞のように事前に静止物体及び移動物体の位置が特定されるならば問題はないが、部屋中ゃ屋外空間を動き回る人間や動物などを数えるとなると、部屋の全域や屋外空間がカメラの画角に収まり切らないか、カメラからの距離により人間や動物などが画像中で大きくなったり小さくなつたりするので、カメラを固定していると視覚装置の用途が制限される。さらに視覚装置は部屋のインテリアと人間や動物とを区別しなければならないので、物体を認識するために膨大な計算量が必要となる。

これらのことを考慮すると、移動力メラが部屋中や屋外空間から人間や動物など特定の物体を探索してこれらの物体だけを撮影し、これらの物体が画像中で適当な大きさになるように視覚装置がカメラの倍率を調整することができれば、視覚装置はこれらの物体を容易に認識することができるばかりか、人間や動物など事前に位置を特定することができない移動物体の数を数えることができるようになる。勿論人間や動物などが寝ていてほとんど動かないとしても、視覚装置は人間や動物などを他の静止物体と区別して人間や動物などの数を数えることができるものと期待される。

そこで、請求項記載の本発明は、動画像中の移動物体又は全物体のいずれかを選択的に選んで生成したェッジ情報を基にして、高速に移動物体又は全物体の数を数えることを目的とする。さらには動画像から移動物体及び静止物体の数を数えることにより、動画像中の移動物体及び静止物体の割合を高速に計算することも目的とする。加えて移動カメラで撮影可能な範囲に存在する移動物体及び静止物体を探索することにより、移動物体及び静止物体の数を高速に数えることも目的とする。

発明の開示

請求項 1の発明は、動画像中の移動物体に対して、前記動画像のフレーム画像を取得する手段と、前記フレーム画像をデジタル画像として順次記憶する手段と、前記デジタル画像から移動物体粗ェッジ情報画像を生成する手段と、前記デジタル画像を用いて前記移動物体粗ェッジ情報画像から移動物体形成ェッジ情報画像を生成する手段と、前記移動物体形成ェッジ情報画像によって区分される移動物体領域の位置及び大きさを検出する手段と、移動物体領域数を数える手段と、前記移動物体領域数を保持する手段と、を有する視覚装置である。前記フレーム画像を取得する前記手段において、前記動画像がアナ„口グ信号の場合は、前記フレーム画像をデジタル信号に変換して前記デジタル画像にする。前記動画像が前記デジタル信号の場合は、圧縮されていれば展開し、圧縮されていなければそのまま入力し、その後前記動画像の中から前記フレーム画像を切り出して前記デジタル画像にする。前記フレーム画像を前記デジタル画像として順次記憶する前記手段では、前記フレーム画像の全ての画素を二次元の位相関係を保ったままメモリに記憶する。前記デジタル画像から前記移動物体粗ェッジ情報画像を生成する前記手段では、前記デジタル画像の画素毎に移動物体のエッジ情報を生成する。前記デジタル画像を用いて前記移動物体粗ェッジ情報画像から前記移動物体形成ェッジ情報画像を生成する前記手段では、前記デジタル画像を用いて、前記移動物体の前記エッジ情報をより的確で明瞭な前記エツジ情報に形成する。前記移動物体形成ェッジ情報画像によって区分される前記移動物体領域の前記位置及び前記大きさを検出する前記手段では、前記移動物体領域の境界にある前記エッジ情報の重心位置及び前記移動物体領域の境界にある前記エッジ情報の数を 1つの画素に代表させる。前記移動物体領域数を数える前記手段では、前記移動物体領域を代表する前記画素の数を数える。前記移動物体領域数を保持する前記手段では、前記移動物体領域を代表する前記画素の数を 2の補数表現や浮動小数点表現など出力先が必要とする形式で出力する。前記手段は各々並列に動作させることができ、また前記移動物体粗エツジ情報画像を生成する前記手段、前記移動物体形成ェッジ情報画像を生成する前記手段、及び前記移動物体領域の前記位置及び前記大きさを検出する前記手段は、各々の内部でも画素毎に並列に動作させることができる。しかもこれらの前記手段は全て局所処理によつて実現される。したがって前記視覚装置は前記移動物体の形や大きさに依存することなく、高速に前記移動物体領域数を数えることができる。また色情報の分類などによって前記移動物体領域を抽出する場合に比べて、前記エッジ情報は照明などの影響を受け難く、しかも透明な前記移動物体に対しても染色することなく、前記エッジ情報は屈折や反射を利用することにより生成されるので、前記視覚装置の応用範囲は広い。したがって前記移動物体の計数に関する諸問題が好適に解決される。請求項 2の発明は、動画像中の移動物体に対して、動画像のフレーム画像を取得する手段と、前記フレ一ム画像をデジタル画像として順次記憶する手段と、前記デジタル画像から移動物体粗エッジ情報画像を生成する手段と、前記デジタル画像を用いて前記移動物体粗エッジ情報画像から移動物体形成エッジ情報画像を生成する手段と、前記移動物体形成エッジ情報画像を用いて背景から移動物体領域を分離する手段と、前記移動物体領域の位置及び大きさを検出する手段と、移動物体領域数を数える手段と、前記移動物体領域数を保持する手段と、を有する視覚装置である。本発明は、請求項 1記載の発明に、前記移動物体形成エッジ情報画像を用いて前記背景から前記移動物体領域を分離する前記手段を追加したものである。前記移動物体形成ェッジ情報画像を用いて前記背景から前記移動物体領域を分離する前記手段では、前記移動物体の前記エッジ情報を境界として、前記背景に含まれる画素と前記移動物体領域に含まれる前記画素を異なるグループに分類することができる。これに伴い、前記移動物体領域の前記位置及び前記大きさを検出する前記手段では、前記移動物体領域の前記重心位置及び前記移動物体領域に含まれる前記画素の数を 1つの前記画素に代表させる。前記手段は各々並列に動作させることができ、また前記移動物体粗ェッジ情報画像を生成する前記手段、前記移動物体形成ェッジ情報画像を生成する前記手段、前記背景から前記移動物体領域を分離する前記手段、及び前記移動物体領域の前記位置及び前記大きさを検出する前記手段は、各々の内部でも画素毎に並列に動作させることができる。しかもこれらの前記手段は全て局所処理によって実現される。したがって前記視覚装置は前記移動物体の形や大きさに依存することなく、高速に前記移動物体領域数を数えることができる。また色情報の分類などによって前記移動物体領域を抽出する場合に比べて、前記エッジ情報によって前記背景から分離された前記移動物体領域は照明などの影響を受け難く、しかも透明な前記移動物体に対しても染色することなく、前記ェッジ情報は屈折や反射を利用することにより生成されるので、前記視覚装置の応用範囲は広い。したがって前記移動物体の計数に関する諸問題が好適に解決される。

請求項 3の発明は、請求項 1又は 2記載の視覚装置に対して、前記デジタル画像を振動させる手段を有することにより、前記移動物体の代りに全物体に対して全物体領域数を数えることを特徵とする視覚装置である。請求項 1記載の視覚装置に対して前記デジタル画像を振動させる前記手段を追加した場合、以下のようになる。前記フレーム画像を取得する手段において、前記動画像がアナログ信号の場合は、前記フレーム画像をデジタル信号に変換して前記デジタル画像にする。前記動画像が前記デジタル信号の場合は、圧縮されていれば展開し、圧縮されていなければそのまま入力し、その後前記動画像の中から前記フレーム画像を切り出して前記デジタル画像にする。前記フレーム画像を前記デジタル画像として順次記憶する前記手段では、前記フレーム画像の全ての前記画素を二次元の位相関係を保つたままメモリに記憶する。前記振動画像から前記全物体粗ェッジ情報画像を生成する前記手段では、前記デジタル画像を画像単位又は画素単位で上下左右に振動させることにより前記振動画像を生成する。これにより、前記振動画像中の前記全物体はあたかも移動しているかのように見える。前記振動画像から前記全物体粗ェッジ情報画像を生成する前記手段では、前記振動画像の前記画素毎に前記全物体の前記エッジ情報を生成する。前記デジタル画像を用いて前記全物体粗ェッジ情報画像から前記全物体形成ェッジ情報画像を生成する前記手段では、前記デジタル画像を用いて、前記全物体の前記エッジ情報をより的確で明瞭な前記ェッジ情報に形成する。前記全物体形成ェッジ情報画像によつて区分される前記全物体領域の前記位置及び前記大きさを検出する前記手段では、前記全物体領域の境界にある前記ェッジ情報の前記重心位置及び前記全物体領域の境界にある前記エッジ情報の数を 1つの画素に代表させる。前記全物体領域数を数える前記手段では、前記全物体領域を代表する前記画素の数を数える。前記全物体領域数を保持する前記手段と、前記全物体領域を代表する前記画素の数を 2の補数表現や浮動小数点表現など出力先が必要とする形式で出力する。前記手段は各々並列に動作させることができ、また前記全物体粗エッジ情報画像を生成する前記手段、前記全物体形成エッジ情報画像を生成する前記手段、及び前記全物体領域の前記位置及び前記大きさを検出する前記手段は、各々の内部でも画素毎に並列に動作させることができる。しかもこれらの前記手段は全て局所処理によって実現される。したがって前記視覚装置は前記全物体の形や大きさに依存することなく、高速に前記全物体領域数を数えることができる。また色情報の分類などによって前記全物体領域を抽出する場合に比べて、前記エッジ情報は照明などの影響を受け難く、 -しかも透明な前記全物体に対しても染色することなく、前記エッジ情報は屈折や反射を利用することにより生成されるので、前記視覚装置の応用範囲は広い。したがって前記全物体の計数に関する諸問題が好適に解決される。

一方で、請求項 2記載の視覚装置に対して前記デジタル画像を振動させる前記手段を追加した場合、以下のようになる。前記全物体形成エッジ情報画像を用いて前記背景から前記全物体領域を分離する前記手段では、前記全物体の前記エッジ情報を境界として、前記背景に含まれる前記画素と前記全物体領域に含まれる前記画素を異なるグループに分類することができる。これに伴い、前記全物体領域の前記位置及び前記大きさを検出する前記手段では、前記全物体領域の重心位置及び前記全物体領域に含まれる前記画素の数を 1 つの前記画素に代表させる。前記手段は各々並列に動作させることができ、また前記全物体粗エッジ情報画像を生成する前記手段、前記全物体形成エッジ情報画像を生成する前記手段、及び前記全物体領域の前記位置及び前記大きさを検出する前記手段は、各々の内部でも画素毎に並列に動作させることができる。しかもこれらの前記手段は全て局所処理によって実現される。したがって前記視覚装置は前記全物体の形や大きさに依存することなく、高速に前記全物体領域数を数えることができる。また色情報の分類などによって前記全物体領域を抽出する場合に比べて、前記エッジ情報によって前記背景から分離された前記全物体領域は照明などの影響を受け難く、しかも透明な前記全物体に対しても染色することなく、前記エッジ情報は屈折や反射を利用することにより生成されるので、前記視覚装置の応用範囲は広い。したがって前記全物体の計数に関する諸問題が好適に解決される。

請求項 1記載の視覚装置と、請求項 1記載の視覚装置に対して前記デジタル画像を振動させる前記手段を追加した請求項 3記載の視覚装置とを組み合せた場合、本発明は請求項 1記載の視覚装置と請求項 3記載の視覚装置との間で、前記デジタル画像から前記移動物体粗エツジ情報画像を生成する前記手段と、前記振動画像から前記全物体粗ェッジ情報画像を生成する前記手段とを共有することができ、前記デジタル画像を用いて前記移動物体粗ェッジ情報画像から前記移動物体形成ェッジ情報画像を生成する前記手段と、前記デジタル画像を用いて前記全物体粗ェッジ情報画像から前記全物体形成ェッジ情報画像を生成する前記手段と、を共有することができ、前記移動物体形成エッジ情報画像によって区分される前記移動物体領域の前記位置及び前記大きさを検出する前記手段と、前記全物体形成ェッジ情報画像によって区分される前記全物体領域の前記位置及び前記大きさを検出する前記手段と、を共有することができ、前記移動物体領域数を数える前記手段と、前記全物体領域数を数える前記手段と、を共有することができ、前記移動物体領域数を保持する前記手段と、前記全物体領域数を保持する前記手段と、を共有することができる。もしハードウェア量の制約があればこれらの前記手段を共有しても構わない。もちろん共有しなければ、それだけ計数時間を短くすることができる。また色情報の分類などによつて前記移動物体領域及び前記全物体領域を抽出する場合に比べて、前記エッジ情報は照明などの影響を受け難く、しかも透明な前記移動物体及び前記全物体に対しても染色することなく、前記エッジ情報は屈折や反射を利用することにより生成されるので、前記視覚装置の応用範囲は広い。したがって前記移動物体及び前記全物体の計数に関する諸問題が好適に解決される。

一方で、請求項 2記載の視覚装置と、請求項 2記載の視覚装置に対して前記デジタル画像を振動させる前記手段を追加した請求項 3記載の視覚装置とを組み合せた場合、本発明は請求項 2記載の視覚装置と請求項 3記載の視覚装置との間で、前記デジタル画像から前記移動物体粗ェッジ情報画像を生成する前記手段と、前記振動画像から前記全物体粗エッジ情報画像を生成する前記手段と、を共有することができ、前記デジタル画像を用いて前記移動物体粗ェッジ情報画像から前記移動物体形成ェッジ情報画像を生成する前記手段と、前記デジタル画像を用いて前記全物体粗ェッジ情報画像から前記全物体形成ェッジ情報画像を生成する前記手段と、を共有することができ、前記移動物体形成エッジ情報画像を用いて前記背景から前記移動物体領域を分離する前記手段と、前記全物体形成ェッジ情報画像を用いて前記背景から前記全物体領域を分離する前記手段と、を共有することができ、前記移動物体領域の前記位置及び前記大きさを検出する前記手段と、前記全物体領域の前記位置及び前記大きさを検出する前記手段と、を共有することができ、前記移動物体領域数を数える前記手段と、前記全物体領域数を数える前記手段と、を共有することができ、前記移動物体領域数を保持する前記手段と、前記全物体領域数を保持する前記手段と、を共有することができる。もしハードウェア量の制約があればこれらの前記手段を共有しても構わない。もちろん共有しなければ、それだけ計数時間を短くすることができる。また色情報の分類などによって前記移動物体領域及び前記全物体領域を抽出する場合に比べて、前記エッジ情報によって前記背景から分離された前記移動物体領域及び前記全物体領域は照明などの影響を受け難く、しかも透明な前記移動物体及び前記全物体に対しても染色することなく、前記ェッジ情報は屈折や反射を利用することにより生成されるので、前記視覚装置の応用範囲は広い。したがって前記移動物体及び前記全物体の計数に関する諸問題が好適に解決される。

さらに請求項 1記載の視覚装置と、請求項 1記載の視覚装置に対して前記デジタル画像を振動させる前記手段を追加した請求項 3記載の視覚装置とを組み合せた視覚装置か、又は請求項 2記載の視覚装置と、請求項 2記載の視覚装置に対して前記デジタル画像を振動させる前記手段を追加した請求項 3記載の視覚装置とを組み合せた視覚装置は、前記移動物体領域数と、前記全物体領域数から前記移動物体領域数を引いた静止物体領域数と、を保持する機能か、又は前記移動物体の割合と、前記全物体から前記移動物体を除いた静止物体の割合と、を保持する機能か、を備えることができる。前者の場合、本発明は、前記全物体領域数を保持する前記手段において、前記全物体領域数から前記移動物体領域数を引くことで前記静止物体領域数を求めることができる。そこで前記全物体領域数を保持する前記手段において、必要に応じて前記全物体領域数の代りに前記静止物体領域数を出力することができる。後者の場合、本発明は、前記移動物体領域数を保持する前記手段において、前記移動物体領域数を前記全物体領域数で割ることで前記移動物体の割合を求めることができる。そこで前記移動物体領域数を保持する前記手段において、必要に応じて前記移動物体領域数の代りに前記移動物体領域の割合を出力することができる。また前記全物体領域数を保持する前記手段において、前記全物体領域数から前記移動物体領域数を引くことで前記静止物体領域数を求めることができるので、前記静止物体領域数を前記全物体頜域数で割ることで前記静止物体の割合を求めることができる。そこで前記全物体領域数を保持する前記手段において、必要に応じて前記全物体領域数の代りに前記静止物体領域の割合を出力することができる。

なお請求項 1、 2及び 3記載の視覚装置において、ビデオカメラによって撮影された前記動画像は複数の前記フレーム画像を連続させることにより、前記フレーム画像中の前記移動物体が移動しているように見せかけている。したがつてデジタルカメラやスキャナなどによって異なる時刻か異なる場所で作成された前記静止画像を連続させることにより、前記静止画像中の前記移動物体が移動しているように見せかけることができる。前記ビデォカメラの代りに前記デジタル力メラゃ前記スキヤナなどを用いることにより、移動速度が遅い前記移動物体の前記移動物体領域数を数える際に前記静止画像の撮影時刻の間隔を容易に調整することができる。またシャーレの中の全細胞の数を数えるといった必ずしも前記ビデオ力メラを必要としないような場合において、前記ビデオ力メラの代りに髙解像度の前記デジタルカメラを用いることができるので、安くしかも精度の高い視覚装置を実現することができる。したがつて前記移動物体及び前記全物体の計数に関する諸問題が好適に解決される。

請求項 4記載の発明は、移動力メラによつて撮影された動画像中の任意物体に対して、前記動画像のフレーム画像を取得する手段と、前記フレーム画像をデジタル画像として順次記憶する手段と、前記デジタル画像から任意物体粗ェッジ情報画像を生成する手段と、前記任意物体粗ェッジ情報画像によって区分される任意物体領域の位置及び大きさを検出する手段と、前記移動カメラの向き及び倍率を環境座標の位置に変換する手段と、前記任意物体領域の前記位置及び前記大きさを前記環境座標の前記位置に変換する手段と、複数の前記任意物体領域に対する前記環境座標の前記位置の中から 1つを選択する手段と、外部からの制御命令を入力する手段と、前記移動力メラを振動させる振動命令を生成する手段と、前記移動カメラが移動すべき前記環境座標の前記位置を制御する手段と、前記移動力メラを制御するカメラ命令を生成する手段と、を有する視覚装置である。前記移動力メラが撮影した前記任意物体が適当な大きさで撮影されるように前記視覚装置は前記移動力メラの前記向き及び前記倍率を調整する。前記動画像から前記任意物体のエッジ情報を生成し、前記エッジ情報を縮退する一連の処理は、全て局所処理によって実現される。これにより前記視覚装置は前記任意物体の形や大きさに依存することなく、高速に前記任 - 意物体を適切な大きさで撮影することができる。また色情報の分類などによって前記任意物体の領域を抽出する場合に比べて、前記エッジ情報は照明などの影響を受け難いので、前記視覚装置の応用範囲は広い。したがって前記任意物体の撮影に関する諸問題が好適に解決される。

請求項 5の発明は、請求項 4記載の視覚装置に対して、前記デジタル画像を用いて前記任意物体粗ェッジ情報画像から前記任意物体形成ェッジ情報画像を生成する手段と、前記任意物体形成エッジ情報画像を用いて背景から前記任意物体領域を分離する手段と、前記任意物体領域を正規化する手段と、任意物体正規化画像を保持する手段と、前記任意物体正規化画像を認識する手段と、認識結果を保持する手段と、前記環境座標で表された環境地図を生成する手段と、前記環境地図を保持する手段と、前記環境地図における前記任意物体の前記位置を推定する手段、任意物体数を数える手段と、前記任意物体数を保持する手段と、前記任意物体形成エッジ情報画像を幾何解析する手段、を有する視覚装置である。本発明の特徴は以下の通りである。第一に前記動画像から前記任意物体の前記エッジ情報を生成し、前記エッジ情報を用いて前記背景から分離した前記任意物体領域を正規化する一連の処理は、全て局所処理によって実現される。これにより前記視覚装置は前記任意物体の形や大きさに依存することなく、高速に前記任意物体正規化画像を生成することができるので、前記視覚装置の応用範囲は広い。したがって前記任意物体の抽出及び正規化に関する諸問題が好適に解決される。第二に、前記動画像から前記任意物体の前記エツジ情報を生成し、前記ェッジ情報を用いて前記背景から分離した前記任意物体領域を正規化する一連の処理は、全て局所処理によって実現される。これにより前記視覚装置は前記任意物体の形や大きさに依存することなく、高速に前記任意物体正規化画像を生成することができる。しかも前記任意物体正規化画像は前記背景を含まないので、前記任意物体正規化画像を認識する方法は、前記背景に囲まれた前記任意物体領域を認識する場合に比べて、前記背景や前記任意物体領域の前記位置及び前記大きさなどの影響を受け難いので、前記視覚装置の応用範囲は広い。したがって前記任意物体の認識に関する諸問題が好適に解決される。第三に、前記任意物体正規化画像を認識した結果と前記移動カメラの前記向き及び前記倍率から前記任意物体の種別と前記環境座標中の位置を表す環境データが作成されるので、前記視覚装置は前記環境データの集合である前記環境地図を作成することができる。前記環境地図は一定期間の前記環境デ一夕を含んでいるので、前記任意物体の前記種別毎に分布や移動状況を記録することができ、前記視覚装置の応用範囲は広い。したがって前記任意物体の記録に関する諸問題が好適に解決される。第四に、前記環境地図を用いると、未だ認識されていない前記任意物体の前記環境座標中の前記位置を求めることができる。また前記移動カメラが撮影可能な範囲に存在する前記任意物体の実際の位置を推定することができるので、前記視覚装置の応用範囲は広い。したがって前記任意物体の探索に関する諸問題が好適に解決される。第五に、前記環境地図に含まれる前記環境データの中から特定の前記認識結果を示すものを抽出して数えることで、前記視覚装置は前記任意物体のうち特定の前記種別に属するものの数を数えることができるので、前記視覚装置の応用範囲は広い。したがって前記任意物体の計数に関する諸問題が好適に解決される。第六に、前記任意物体から生成した前記エッジ情報の大ざっぱな形状を解析することにより、前記任意物体正規化画像中の前記任意物体の前記種別を推定できるので、前記任意物体正規化画像を認識する前記手段はより高速で正確に前記任意物体正規化画像を認識することができる。また前記任意物体正規化画像中の前記任意物体が認識の対象でない場合には、前記任意物体正規化画像を認識する前記手段が前記認識結果を生成する前に前記環境地図を生成することができるので、前記視覚装置の応用範囲は広い。したがって前記任意物体の認識、探索及び計数に関する諸問題が好適に解決される。

請求項 6の発明は、デジタル画像を振動させる手段を実現するデータ処理装置において格子状に配置された配列演算ュニッ卜の各々に対して、前記配列演算ュニットを初期化する手段と、入力すべき前記デジタル画像がなければ処理を終了する手段と、前記デジタル画像の各帯域画素値を入力する手段と、前記デジタル画像の前記各帯域画素値を上下左右に振動させる手段と、振動画像の各帯域画素値を出力する手段と、を備えたことを特徴とする視覚装置である。つまり、これは前記配列演算ユニットが提供する前記デジタル画像の振動機能をデジタル技術で実現するためのアルゴリズムの実装形態である。前記配列演算ュニットを格子状に配置し、前記配列演算ュニットを近傍同士相互に結合し、前記配列演算ュニッ卜の各パラメータの初期値を設定した後に、前記デジタル画像を画素単位で適宜入力し、前記デジタル画像の各帯域画素値の振動から前記振動画像の各帯域画素値の出力までを順次行い、前記デジタル画像が入力されなくなるまで繰り返す。これにより汎用的なプロセッサを利用することができ、前記パラメ一夕の修正を容易にすることができる。

請求項 7の発明は、デジタル画像から粗エッジ情報画像を生成する手段を実現するデ一夕処理装置において格子状に配置された配列演算ユニットの各々に対して、前記配列演算ユニットを初期化する手段と、入力すべき前記デジタル画像がなければ処理を終了する手段と、前記デジタル画像の各帯域画素値を入力する手段と、前記デジタル画像の前記各帯域画素値を平滑化して平滑化画像の各帯域画素値を生成する手段と、前記平滑化画像の前記各帯域画素値の対数を取って対数変換画像の各帯域画素値を生成する手段と、前記対数変換画像の前記各帯域画素値を鮮鋭化して鮮鋭化画像の各帯域画素値を生成する手段と、前記鮮鋭化画像の前記各帯域画素値から 1入力前鮮鋭化画像の各帯域画素値を引いて時間差分画像の各帯域画素値を生成する手段と、前記鮮鋭化画像の前記各帯域画素値を前記 1 入力前鮮鋭化画像の前記各帯域画素値に置き換える手段と、前記時間差分画像の前記各帯域画素値に対してラプラシアンを計算して時間差分ラプラシアン画像の各帯域画素値を生成する手段と、前記時間差分ラプラシアン画像の前記各帯域画素値のゼロ点を抽出して時間差分ゼロ点画像の各帯域画素値を生成する手段と、前記時間差分ゼロ点画像の前記各帯域画素値の最大値を求めて最大値時間差分ゼロ点画像の帯域画素値を生成する手段と、前記鮮鋭化画像の前記各帯域画素値に対して前記ラプラシアンを計算してラブラシアン画像の各帯域画素値を生成する手段と、前記ラプラシアン画像の前記各帯域画素値の前記ゼ口点を抽出してゼロ点画像の各帯域画素値を生成する手段と、前記ゼロ点画像の前記各帯域画素値の最大値を求めて最大値ゼ口点画像の帯域画素値を生成する手段と、前記最大値ゼ口点画像の前記帯域画素値と前記最大値時間差分ゼ口点画像の前記帯域画素値のうち大きい方を求めて混成ゼロ点画像の帯域画素値を生成する手段と、前記混成ゼロ点画像の孔を除去して孔除去混成ゼロ点画像の帯域画素値を生成する手段と、前記孔除去混成ゼロ点画像の孤立点および孤立孔を除去してノィズ除去混成ゼ口点画像の帯域画素値を生成する手段と、前記ノイズ除去混成ゼロ点画像の前記各帯域画素値を反転して粗エッジ情報画像の帯域画素値を生成する手段と、前記粗エッジ情報画像の前記帯域画素値を出力する手段と、を備えたことを特徴とする視覚装置である。つまり、これは前記配列演算ユニットが提供する前記粗エッジ情報画像の生成機能をデジタル技術で実現するためのアルゴリズムの実装形態である。前記配列演算ュニットを格子状に配置し、前記配列演算ュニッ卜を近傍同士相互に結合し、前記配列演算ユニットの各パラメ一夕の初期値を設定した後に、前記デジタル画像を画素単位で適宜入力し、前記デジタル画像の平滑化から前記粗エッジ情報画像の各帯域画素値の出力までを順次行い、前記デジタル画像が入力されなくなるまで繰り返す。これにより汎用的なプロセッサを利用することができ、前記パラメ一夕の修正を容易にすることができる。なお前記配列演算ユニットは、近傍にある前記配列演算ュニットから送信されてくる各種前記画像の近傍画素の受信待ちを必ずしも厳密に行う必要はない。というのも、近傍にある前記配列演算ユニットから各種前記画像の前記近傍画素を受信することができない場合には、受信待ちをしている前記配列演算ュニットは自分自身の前記帯域画素値を代用することができるからである。このとき前記配列演算ュニットが生成する各種前記画像の画素に多少のノイズが乗ってしまう可能性があるが、本発明では、殆んどのノイズは前記手段の各々において吸収されてしまうのである。自分自身の前記帯域画素値を代用する手段により、辺縁処理とタイムアウト処理が同時に、しかも簡単に実現される。

請求項 8の発明は、粗エツジ情報画像から形成ェッジ情報画像を生成する手段を実現するデータ処理装置において格子状に配置された配列演算ユニットの各々に対して、前記配列演算ユニットを初期化する手段と、入力すべきデジタル画像又は前記粗エッジ情報 ¾像がなければ処理を終了する手段と、前記デジ夕ル画像の各帯域画素値及び前記粗ェッジ情報画像の帯域画素値を入力する手段と、前記デジタル画像の前記各帯域画素値と前記粗エッジ情報画像の前記帯域画素値を分離する手段と、前記デジタル画像の前記各帯域画— 素値を平滑化して平滑化画像の各帯域画素値を生成する手段と、前記平滑化画像の前記各帯域画素値の対数を取って対数変換画像の各帯域画素値を生成する手段と、前記対数変換画像の前記各帯域画素値を鮮鋭化して鮮鋭化画像の各帯域画素値を生成する手段と、前記鮮鋭化画像の前記各帯域画素値に対してラプラシアンを計算してラプラシアン画像の各帯域画素値を生成する手段と、前記ラプラシアン画像の前記各帯域画素値のゼロ点を抽出してゼロ点画像の各帯域画素値を生成する手段と、前記ゼ口点画像の前記各帯域画素値の最大値を求めて最大値ゼロ点画像の帯域画素値を生成する手段と、前記最大値ゼロ点画像の前記帯域画素値を反転して基礎ェッジ情報画像の帯域画素値を生成する手段と、前記基礎エッジ情報画像の前記帯域画素値に近づくように前記粗エッジ情報画像の帯域画素値を整形する手段と、前記粗エッジ情報画像の前記帯域画素値の線幅を補間して形成エツジ情報画像の帯域画素値を生成する手段と、前記形成エッジ情報画像の前記帯域画素値を出力する手段と、を備えたことを特徴とする視覚装置である。つまり、これは前記配列演算ュニットが提供する前記形成ェッジ情報画像の生成機能をデジタル技術で実現するためのァルゴリズムの実装形態である。前記配列演算ュニットを格子状に配置し、前記配列演算ュニットを近傍同士相互に結合し、前記配列演算ュニットの各パラメータの初期値を設定した後に、前記デジタル画像及び前記粗エッジ情報画像を画素単位で適宜入力し、前記デジタル画像と前記粗ェッジ情報画像の分離から前記形成ェッジ情報画像の各帯域画素値の出力までを順次行い、前記デジタル画像及び前記粗ェッジ情報画像が入力されなくなるまで繰り返す。これにより汎用的なプロセッサを利用することができ、前記パラメ一夕の修正を容易にすることができる。なお前記配列演算ユニットは、近傍にある前記配列演算ュニッ卜から送信されてくる各種前記画像の近傍画素の受信待ちを必ずしも厳密に行う必要はない。というのも、近傍にある前記配列演算ユニットから各種前記画像の前記近傍画素を受信することができない場合には、受信待ちをしている前記配列演算ユニットは自分自身の前記帯域画素値を代用することができるからである。このとき前記配列演算ュニッ卜が生成する各種前記画像の画素に多少のノイズが乗ってしまう可能性があるが、本発明では、殆んどのノイズは前記手段の各々において吸収されてしまうのである。自分自身の _ 前記帯域画素値を代用する手段により、辺縁処理とタイムアウト処理が同時に、しかも簡単に実現される。

請求項 9の発明は、物体領域の位置及び大きさを検出する手段を実現するデータ処理装置において格子状に配置された配列演算ユニットの各々に対して、前記配列演算ュニットを初期化する手段と、入力すべき粗エッジ情報画像がなければ処理を終了する手段と、前記粗エッジ情報画像の帯域画素値を入力する手段と、前記粗エッジ情報画像の前記帯域画素値を重複情報画像の帯域画素値に変換する手段と、前記重複情報画像から計算した移動量を移動量画像の帯域画素値に画像化する手段と、前記移動量画像の前記帯域画素値が指し示す移動位置に前記重複情報画像の前記帯域画素値を移動する手段と、前記重複情報画像の前記帯域画素値を前記重複情報画像の移動元の前記帯域画素値の合計に更新する手段と、前記重複情報画像の前記帯域画素値を出力する手段と、を備えたことを特徴とする視覚装置である。つまり、これは前記配列演算ュニットが提供する、前記粗ェッジ情報画像が指し示す前記物体領域の前記位置及び前記大きさを表す前記重複情報画像の生成機能をデジタル技術で実現するためのアルゴリズムの実装形態である。前記配列演算ュニットを格子状に配置し、前記配列演算ユニットを近傍同士相互に結合し、前記配列演算ュニットの各パラメータの初期値を設定した後に、前記粗ェッジ情報画像を画素単位で適宜入力し、前記重複情報画像への変換から前記重複情報画像の各帯域画素値の出力までを順次行い、前記粗エッジ情報画像が入力されなくなるまで繰り返す。これにより汎用的なプロセッサを利用することができ、前記パラメ一夕の修正を容易にすることができる。なお前記配列演算ユニットは、近傍にある前記配列演算ュニットから送信されてくる各種前記画像の近傍画素の受信待ちを必ずしも厳密に行う必要はない。というのも、近傍にある前記配列演算ユニットから各種前記画像の前記近傍画素を受信することができない場合には、受信待ちをしている前記配列演算ユニットは 0に相当する画素値を代用することができるからである。このとき前記配列演算ュニッ卜が生成する各種前記画像の画素に多少のノィズが乗ってしまう可能性があるが、本発明では、殆んどのノイズは前記手段の各々において吸収されてしまうのである。この 0に相当する前記帯域画素値を代用する手段により、辺縁処理とタイムアウト処理が同時に、しかも簡単に実現される。

本発明は、前記粗エッジ情報画像の代りに形成エッジ情報画像を入力することができる。前記形成ェッジ情報画像が指し示す前記物体領域の前記位置及び前記大きさを表す前記重複情報画像を生成するために、前記配列演算ユニットを格子状に配置し、前記配列演算ュニッ卜を近傍同士相互に結合し、前記配列演算ュニットの各パラメータの初期値を設定した後に、前記形成エッジ情報画像を画素単位で適宜入力し、前記重複情報画像への変換から前記重複情報画像の各帯域画素値の出力までを順次行い、前記形成ェッジ情報画像が入力されなくなるまで繰り返す。これにより汎用的なプロセッサを利用することができ、前記パラメ一夕の修正を容易にすることができる。なお前記配列演算ユニットは、近傍にある前記配列演算ュニッ卜から送信されてくる各種前記画像の近傍画素の受信待ちを必ずしも厳密に行う必要はない。というのも、近傍にある前記配列演算ユニットから各種前記画像の前記近傍画素を受信することができない場合には、受信待ちをしている前記配列演算ュニットは 0に相当する前記帯域画素値を代用することができるからである。このとき前記配列演算ュニッ卜が生成する各種前記画像の画素に多少のノイズが乗ってしまう可能性があるが、本発明では、殆んどのノイズは前記手段の各々において吸収されてしまうのである。この 0に相当する前記帯域画素値を代用する手段により、辺縁処理とタイムアウト処理が同時に、しかも簡単に実現される。

また本発明は、前記粗エッジ情報画像の代りに前記物体領域画像を入力することができる。前記物体領域画像が指し示す前記物体領域の前記位置及び前記大きさを表す前記重複情報画像を生成するために、前記配列演算ユニットを格子状に配置し、前記配列演算ュニットを近傍同士相互に結合し、前記配列演算ュニットの各パラメ一夕の初期値を設定した後に、前記物体領域画像を画素単位で適宜入力し、前記重複情報画像への変換から前記重複情報画像の各帯域画素値の出力までを順次行い、前記物体領域画像が入力されなくなるまで繰り返す。これにより汎用的なプロセッサを利用することができ、前記パラメータの修正を容易にすることができる。なお前記配列演算ユニットは、近傍にある前記配列演算ユニットから送信されてくる各種前記画像の近傍画素の受信待ちを必ずしも厳密に行う必要はない。というのも、近傍にある前記配列演算ユニットから各種前記画像の前記近傍画素を受信することができない場合には、受信待ちをしている前記配列演算ユニットは 0 に相当する前記帯域画素値を代用することができるからである。このとき前記配列演算ュニットが生成する各種前記画像の画素に多少のノィズが乗ってしまう可能性があるが、本発明では、殆んどのノイズは前記手段の各々において吸収されてしまうのである。この 0に相当する前記帯域画素値を代用する手段により、辺縁処理とタイムアウト処理が同時に、しかも簡単に実現される。

請求項 1 0の発明は、物体領域を正規化する手段を実現するデータ処理装置において格子状に配置された配列演算ュニットの各々に対して、前記配列演算ュニットを初期化する手段と、入力すべき物体領域画像又はデジタル画像がなければ処理を終了する手段と、前記物体領域画像の帯域画素値及び前記デジタル画像の各帯域画素値を入力する手段と、前記物体領域画像の前記帯域画素値と前記デジタル画像の前記各帯域画素値を分離して更新物体領域画像の帯域画素値及び更新画像の各帯域画素値を生成する手段と、前記更新物体領域画像から計算した移動量を移動量画像の帯域画素値に画像化する手段と、前記移動量画像の前記帯域画素値が指し示す移動位置の重複数に従い移動可能画像の帯域画素値を生成する手段と、前記移動可能画像の判定に従い前記更新物体領域画像の前記帯域画素値を前記移動位置に移動する手段と、前記更新物体領域画像の前記帯域画素値の移動に合わせて前記更新画像の前記各帯域画素値を移動する手段と、前記物体領域に含まれない前記更新物体領域画像の前記帯域画素値に対して前記物体領域に含まれる近傍帯域画素値の平均値で補間する手段と、前記更新物体領域画像の前記帯域画素値の補間に合わせて前記更新画像の前記各帯域画素値を補間する手段と、前記更新画像を補間して生成した正規化画像の各帯域画素値を出力する手段と、を備えたことを特徴とする視覚装置である。つまり、これは前記配列演算ユニットが提供する、前記正規化画像の生成機能をデジタル技術で実現するためのアルゴリズムの実装形態である。前記配列演算ュニットを格子状に配置し、前記配列演算ュニッ卜を近傍同士相互に結合し、前記配列演算ュニットの各パラメータの初期値を設定した後に、前記物体領域画像及び前記デジタル画像を画素単位で適宜入力し、前記物体領域画像と前記デジタル画像の分離から前記正規化画像の各帯域画素値の出力までを順次行い、前記物体領域画像及び前記デジタル画像が入力されなくなるまで繰り返す。これにより汎用的なプロセッサを利用することができ、前記パラメータの修正を容易にすることができる。なお前記配列演算ユニットは、近傍にある前記配列演算ュニットから送信されてくる各種前記画像の近傍画素の受信待ちを必ずしも厳密に行う必要はない。というのも、近傍にある前記配列演算ユニットから各種前記画像の前記近傍画素を受信することができない場合には、受信待ちをしている前記配列演算ユニットは 0に相当する画素値を代用することができるからである。このとき前記配列演算ュニットが生成する各種前記画像の画素に多少のノイズが乗ってしまう可能性があるが、本発明では、殆んどのノイズは前記手段の各々において吸収されてしまうのである。この 0に相当する前記帯域画素値を代用する手段により、辺縁処理とタイムアウト処理が同時に、しかも簡単に実現される。

請求項 1 1の発明は、正規化画像を認識する手段のうちパターンマッチングを実現するデータ処理装置において格子状に配置された配列演算ユニットの各々に対して、前記配列演算ュニットを格子状に配置する手段と、前記配列演算ュニットを初期化する手段と、入力すべきテンプレート画像がなくなるまで前記テンプレート画像の帯域画素値を入力する手段と、入力すべき前記正規化画像がなければ処理を終了する手段と、前記正規化画像の帯域画素値を入力する手段と、マッチング結果を計算する手段と、マッチング結果画像を更新する手段と、前記マッチング結果画像の帯域画素値を出力する手段と、を備えたことを特徴とする視覚装置である。つまり、これは前記画像認識手段のうち前記配列演算ュニッ卜が提供するパターンマッチングをデジタル技術で実現するためのアルゴリズムの実装形態である。前記配列演算ュニットを格子状に配置し、前記配列演算ュニットを近傍同士相互に結合し、前記配列演算ユニットの各パラメータの初期値を設定した後に、前記テンプレート画像及び前記正規化画像を画素単位で適宜入力し、前記マッチング結果の計算から前記マッチング結果画像の各帯域画素値の出力までを順次行い、前記正規化画像が入力されなくなるまで繰り返す。これにより汎用的なプロセッサを利用することができ、前. 記パラメ一夕の修正を容易にすることができる。なお前記配列演算ユニットは、近傍にある前記配列演算ユニットから送信されてくる各種前記画像の近傍画素の受信待ちを必ずしも厳密に行う必要はない。というのも、近傍にある前記配列演算ユニットから各種前記画像の前記近傍画素を受信することができない場合には、受信待ちをしている前記配列演算ユニットは自分自身の前記帯域画素値を代用することができるからである。このとき前記配列演算ュニットが生成する各種前記画像の画素に多少のノイズが乗ってしまう可能性があるが、本発明では、殆んどのノイズは前記手段の各々において吸収されてしまうのである。自分自身の前記帯域画素値を代用する手段により、辺縁処理とタイムアウト処理が同時に、しかも簡単に実現される。

請求項 1 2の発明は、形成エッジ情報画像を用いて物体領域を分離する手段を実現するデータ処理装置において格子状に配置された配列演算ユニットの各々に対して、前記配列演算ユニットを格子状に配置する手段と、前記配列演算ユニット中の非線形振動子と、前記非線形振動子の近傍にある前記非線形振動子とを結合値で接続する手段と、前記配列演算ュニットを初期化する手段と、入力すべき前記形成エッジ情報画像がなければ処理を終了する手段と、前記形成エッジ情報画像の帯域画素値を入力する手段と、外乱を計算する手段と、前記非線形振動子の近傍入力合計を計算する手段と、前記非線形振動子のパラメータを計算する手段と、前記非線形振動子の出力を計算する手段と、輪郭パラメ一夕を計算する手段と、境界パラメ一夕を計算する手段と、前記非線形振動子によって分離された前記物体領域を含む物体領域画像の帯域画素値を出力する手段と、を備えたことを特徴とする視覚装置である。つまり、これは前記配列演算ユニットが提供する前記物体領域画像の生成機能をデジタル技術で実現するためのアルゴリズムの実装形態である。前記配列演算ュニットを格子状に配置し、前記配列演算ュニットを近傍同士相互に結合し、前記配列演算ユニットの各パラメ一夕の初期値を設定した後に、前記形成エッジ情報画像を画素単位で適宜入力し、前記外乱の計算から前記物体領域画像の各帯域画素値の出力までを順次行い、前記形成エッジ情報画像が入力されなくなるまで繰り返す。これにより汎用的なプロセッサを利用することができ、前記パラメ一夕の修正を容易にすることができる。なお前記配列演算ユニットは、近傍にある前記配列演算ュニッ卜から送信されてくる前記各パラメータや各種前記画像の近傍画素の受信待ちを必ずしも厳密に行う必要はない。というのも、近傍にある前記配列演算ュニットから前記各パラメ一夕や各種前記画像の前記近傍画素を受信することができない場合には、受信待ちをしている前記配列演算ュニットは自分自身のパラメ一夕値や画素値を代用することができるからである。このとき前記配列演算ュニッ卜が生成する前記各パラメ一夕や各種前記画像の画素に多少のノイズが乗つてしまう可能性があるが、本発明では、殆んどのノイズは前記手段の各々において吸収されてしまうのである。自分自身の前記パラメ一夕値や前記帯域画素値を代用する手段により、辺縁処理とタイムアウト処理が同時に、しかも簡単に実現される。

請求項 1 3の発明は、データを入力する手段と、前記データを順次記憶する手段と、配列演算ユニット間で前記データを転送する手段と、前記デ一夕を用いて計算する手段と、前記データを出力する手段と、を有する前記配列演算ユニットに対して、前記配列演算ュニットを格子状に配置する手段と、前記配列演算ュニットの各々の位置関係から近傍同士を相互結合する手段と、隣接する前記配列演算ユニット間で前記デ一夕を通信する手段と、前記配列演算ユニットの各々を独立に動作させる手段と、を特徴とする視覚装置である。前記データを入力する前記手段と、前記データを順次記憶する前記手段と、前記配列演算ュニット間で前記データを転送する前記手段と、前記デ一夕を用いて計算する前記手段と、前記データを出力する前記手段に関して、各々の前記配列演算ユニットは格子状に配列された場所に関わらず同じ動作ステップを有している。これにより前記配列演算ュニットをハードウェアによって実装する場合には、前記配列演算ユニットを実現する同じ回路を平面上に規則正しく配置することができ、それらの回路は隣接するもののみを接続すれば良いので配線量も少なくて済み、取り扱う画像のサイズに合わせて回路の数を増減させるだけで良く、しかもそれぞれの回路は並列に動作させられる。また前記配列演算ュニットをソフトウェアによって実装する場合には、前記配列演算ュニットを格子状に並べた視覚装置を並列性の高いプログラムによって実行することができる。

請求項 1 4の発明は、配列演算ユニットは、入力したデ一夕を処理する手段を備えたプ口セッサと、前記データを処理するプログラムと変数を記憶するためのメモリと、隣接する前記配列演算ユニットと通信するためのコントローラと、を備え、前記コントローラは、入力した前記データを前記メモリに記憶する手段と、前記メモリ中の前記変数を隣接する前記配列演算ユニットに送信する手段と、隣接する前記配列演算ユニットから送信された前記変数を前記メモリに記憶する手段と、を備えたことを特徴とする視覚装置である。つまり、前記配列演算ユニットをハードウェアで実装するための回路である。前記配列演算ユニットは、入力された前記データを処理するための汎用プロセッサと、前記デー夕を処理するプログラムと変数を記憶するための汎用メモリを用いることができる。前記コントローラは、前記配列演算ユニットが最大 4近傍と相互結合している場合には、隣接した前記配列演算ュニッ卜のみに変数を送信するだけで良いが、前記配列演算ュニットが 8近傍以上と相互結合しなければならない場合、 4近傍に含まれない前記配列演算ュニッ卜の前記変数は、一旦隣りの前記配列演算ユニットに送信されるので、前記変数を自分に再度送信してもらうことで受信することができる。また前記メモリ中の前記各変数を隣接する前記配列演算ュニットに送信する前記手段で自分の前記変数を 4近傍に含まれない前記配列演算ユニットに送信することもできる。これにより前記配列演算ユニットは、ハードウエアとしては隣接した前記配列演算ュニットのみと結線するにも関わらず、 8近傍以上の前記配列演算ュニットと適切な前記データを通信することができる。また前記課題のうちハードウェアの実装及び実時間処理に関する諸問題が好適に解決される。図面の簡単な説明

第 1図は、フレーム画像から移動物体数を数える視覚装置のブロック図である。第 2図は、物体 Z背景分離手段を用いてフレーム画像から移動物体数を数える視覚装置のブ口ック図である。第 3図は、フレーム画像から全物体数を数える視覚装置のブロック図である。第 4図は、物体背景分離手段を用いてフレーム画像から全物体数を数える視覚装置のブロック図である。第 5図は、移動物体と静止物体の割合を求める視覚装置のブロック図である。第 6図は、移動カメラを制御する視覚装置のブロック図である。第 7図は、物体の正規化画像を生成する視覚装置のブロック図である。第 8図は、物体の認識結果を出力する視覚装置のブロック図である。第 9図は、環境地図を生成する視覚装置のブロック図である。第 1 0図は、環境地図を用いて移動カメラを制御する視覚装置のブロック図である。第 1 1図は、任意物体数を数える視覚装置のブロック図である。第 1 2図は、幾何解析により高速化した視覚装置のブロック図である。第 1 3図は、配列演算ユニットを格子状に配置されたブロック図である。第 1 4図は、本実施形態の画像記憶手段のアルゴリズムを示すフローチャートである。第 1 5図は、本実施形態の画像振動手段のァルゴリズムを示すフローチャートである。第 1 6図は、本実施形態のエッジ情報生成手段のァルゴリズムを示すフローチャートである。第 1 7図は、デジタル画像を用いて粗エッジ情報を形成エッジ情報に形成する場合の説明図である。第 1 8図は、本実施形態のエッジ情報形成手段のアルゴリズムを示すフローチャートである。第 1 9図は、低解像度デジタル画像から生成された低解像度粗エッジ情報を形成エッジ情報に形成する場合の説明図である。第 2 0図は、低解像度デジタル画像から生成された低解像度粗エッジ情報の領域を切り出してから形成エッジ情報に形成する場合の説明図である。第 2 1図は、エッジ情報画像中の物体の位置及び大きさを検出する場合の説明図である。第 2 2図は、本実施形態の位置 /大きさ検出手段のアルゴリズムを示すフローチャートである。第 2 3図は、物体領域画像中の物体の位置及び大きさを検出する場合の説明図である。第 2 4図は、デジタル画像の切出領域を正規化する場合の説明図である。第 2 5図は、本実施形態の領域正規化手段のアルゴリズムを示すフローチャートである。第 2 6図は、本実施形態の正規化画像保持手段のアルゴリズムを示すフローチャートである。第 2 7図は、正規化画像に対してテンプレート画像の中からパターンマッチングをする場合の説明図である。第 2 8図は、本実施形態の画像認識手段のうちパターンマッチングのアルゴリズムを示すフローチヤ一トである。第 2 9図は、三角形のエッジ情報が三角形の内側領域と外側領域に分離する状態を示す説明図である。第 3 0図は、本実施形態の物体/背景分離手段のアルゴリズムを示すフローチャートである。第 3 1図は、破線状態の三角形のエッジ情報が破線三角形の内側領域と外側領域に分離する状態を示す説明図である。第 3 2図は、三角形を 2つ重ねたエッジ情報が 2つの三角形領域と背景領域に分離する状態を示す説明図である。第 3 3 図は、 2つの円形物体領域を重ねた時の破線状態のエッジ情報が 2つの円形領域と背景領域に分離した状態を示す説明図である。第 3 4図は、配列演算ユニットの内部構造のブロック図である。第 3 5図は、コントローラのブロック図である。第 3 6図は、フラグデコーダの入出力信号を示す説明図である。第 3 7図は、フラグエンコーダの入出力信号を示す説明図である。第 3 8図は、プロセッサがコントローラを介して隣接する配列演算ュニットにデ一夕を送信するアルゴリズムを示すフローチャートである。第 3 9図は、コントロ一ラが隣接する配列演算ュニットからデータを受信するアルゴリズムを示すフローチャートである。第 4 0図は、プロセッサが上入力レジス夕からデ一夕を受信するァルゴリズムを示すフローチャートである。発明を実施するための最良の形態

以下、第 1図ないし第 1 2図に示す 1 2個の視覚装置の実施形態を説明する。これらの実施形態は、ビデオカメラの撮像信号（フレーム画像 1 ) を受信して適切なフォーマットとサイズのデジタル画像 1 1 1に変換する画像取得手段 1 1 (第 1図参照）と、デジタル画像 1 1 1を一定期間記憶する画像記憶手段 1 2 (第 1図参照）と、デジタル画像 1 1 1 をデジタル回路を用いて振動させる画像振動手段 1 3 (第 3図参照）と、 2つのデジ夕ル画像 1 1 1から移動物体 2又は静止物体 3の粗エッジ情報 1 1 2を生成するエッジ情報生成手段 1 4 (第 1図及び第 3図参照）と、粗エツジ情報 1 1 2をより的確で明瞭な形成エッジ情報 1 1 4に形成するエッジ情報形成手段 1 5 (第 1図参照）と、形成エッジ情報 1 1 4によって区分される領域を分離する物体 Z背景分離手段 1 6 (第 2図参照）と、形成エッジ情報 1 1 4によって区分されたか若しくは分離された各領域の位置及び大きさを検出する位置ノ大きさ検出手段 1 7 (第 1図及び第 2図参照）と、適当な大きさがある領域の位置から領域数を数える画素計数手段 1 8 (第 1図参照）と、領域数又は領域数の割合を出力する画素数保持手段 1 9 (第 1図及び第 5図参照）等を利用したものであり、図面を参照して説明する。

第 1図に示すように、移動物体計数部 1 0 1は、ビデオカメラで撮影された動画像のフレーム画像 1を画像取得手段 1 1に入力して、画像記憶手段 1 2、エッジ情報生成手段 1 4、エッジ情報形成手段 1 5、位置大きさ検出手段 1 7、画素計数手段 1 8、画素数保持手段 1 9の順に受け渡すことで、フレーム画像 1に写っている移動物体 2の数を出力する。なお、フレーム画像 1はデジタルカメラで連続撮影された静止画像でも良い。

画像取得手段 1 1がビデオカメラから動画像のフレーム画像 1を入力する際に、動画像がアナログ信号の場合は、一般的なキヤプチャ一ボードを用いることによりフレーム画像 1を AZD変換によりデジタル信号に変換してデジタル画像 1 1 1にする。なお特に C C D撮像素子などの電圧を直接入力できるならば、 AZD変換により適当なビット数のデジタル信号に変換するだけで良い。動画像がデジタル信号の場合は、圧縮されていれば展開し、圧縮されていなければそのまま入力する。これにより動画像中任意のフレーム画像 1 を切り出すことができるので、このフレーム画像 1を切り出してデジタル画像 1 1 1にする。変換されたデジタル画像 1 1 1は適当なフォーマットに従いながら任意の画像サイズを有しているので、画像取得手段 1 1は画素単位で画像デ一夕を参照できるフォーマットに変換し、移動物体計数部 1 0 1で必要とする画像サイズ分を切り出し、デジタル画像 1 1 1として出力する。もし画像取得手段 1. 1がデジタル画像 1 1 1の全ての画素を並列に出力することができれば、画像取得手段 1 1から画像記憶手段 1 2への通信は、画素毎に並列に行うことができる。

画像記憶手段 1 2が画像取得手段 1 1からデジタル画像 1 1 1を入力すると、移動物体計数部 1 0 1の時間分解能若しくは各手段の計算能力に合わせて一定時間デジタル画像 1 1 1を記憶する。つまりこの一定時間中にデジタル画像 1 1 1が入力されても画像記憶手段 1 2は記憶画像を変更することがないので、後に続く各手段は異なるタイミングで同じデジタル画像 1 1 1を入力することができる。しかも画像記憶手段 1 2はデジタル画像 1 1 1に対して画像処理を施さないので、デジタル画像 1 1 1の全ての画素に対して二次元の位相関係を保ったまま記憶している。もし画像記憶手段 1 2がデジタル画像 1 1 1の全ての画素を並列に出力することができれば、画像記憶手段 1 2からエッジ情報生成手段 1 4への通信は、画素毎に並列に行うことができる。

エッジ情報生成手段 1 4が画像記憶手段 1 2からデジタル画像 1 1 1を入力すると、直前に入力されたデジタル画像 1 1 1と比較することにより移動物体 2の粗エッジ情報画像 1 1 3を生成する。エッジ情報生成手段 1 4は画素毎に近傍処理のみで粗エッジ情報画像 1 1 3を生成することができるので、並列化に向いている。もしエッジ情報生成手段 1 4 が粗エッジ情報画像 1 1 3の全ての画素を並列に出力することができれば、エッジ情報生成手段 1 4からエッジ情報形成手段 1 5への通信は、画素毎に並列に行うことができる。エッジ情報形成手段 1 5がエッジ情報生成手段 1 4から粗エッジ情報画像 1 1 3を入力すると、画像記憶手段 1 2で記憶されていたデジタル画像 1 1 1を参照して、粗エッジ情報画像 1 1 3より的確で明瞭な移動物体 2の形成エッジ情報画像 1 1 5を生成する。エツジ情報形成手段 1 5は画素毎に近傍処理のみで形成エッジ情報画像 1 1 5を生成することができるので、並列化に向いている。もしエッジ情報形成手段 1 5が形成エッジ情報画像 1 1 5の全ての画素を並列に出力することができれば、エッジ情報形成手段 1 5から位置大きさ検知手段 1 7への通信は、画素毎に並列に行うことができる。

位置大きさ検出手段 1 7がエッジ情報形成手段 1 5から形成エッジ情報画像 1 1 5を入力すると、形成エッジ情報 1 1 4によって指し示された移動物体 2の領域の位置及び大きさを検出する。位置/大きさ検出手段 1 7は画素毎に近傍処理のみで移動物体 2の領域の位置及び大きさの検出結果を表す重複情報画像 1 3 2を生成することができるので、並列化に向いている。もし位置/大きさ検出手段 1 7が重複情報画像 1 3 2の全ての画素を並列に出力することができれば、位置ノ大きさ検出手段 1 7から画素計数手段 1 8への通信は、画素毎に並列に行うことができる。

画素計数手段 1 8が位置 Z大きさ検出手段 1 7から重複情報画像 1 3 2を入力すると、適当な大きさの移動物体 2の領域の位置を表す画素の数を数える。この処理は並列処理よりも逐次処理で行う方が便利である。そのため重複情報画像 1 3 2の各画素は線形メモリに記憶される。移動物体 2の領域の位置を表す画素の数は画素計数手段 1 8から画素数保持手段 1 9へ出力される。

画素数保持手段 1 9が画素計数手段 1 8から画素数を入力すると、画素数を 2の補数表現や浮動小数点表現など出力先が必要とする形式に変換して、必要な期間出力する。つまり移動物体計数部 1 0 1が移動物体数を出力することができる。

前記各手段が独立したハードウェアによって実装されれば並列に計算することができるので、移動物体計数部 1 0 1は実時間性を有することができる。したがって移動速度が速い物体の数を数える際や、大量の動画像を短時間で処理する場合には適している。また、幾つかの手段が 1つのプロセッサ上でソフトウェアによって実装されれば、計算速度は遅くなる代りに安価に製造することができる。したがつて計数結果が出るまでに数分以上掛つても構わないような応用例に向いている。

さて、エッジ情報形成手段 1 5が生成した形成エッジ情報画像 1 1 5を用いて位置 Z大きさ検出手段 1 7が移動物体 2の領域の位置及び大きさを検出した場合、移動物体 2の密度によっては移動物体 2の領域の位置を表す画素の数が移動物体 2の数と異なる可能性がある。主な原因は、形成エッジ情報 1 1 4が移動物体 2のエッジを正確に抽出しているとは限らないことと、位置大きさ検出手段 1 7が形成エッジ情報 1 1 4から移動物体 2 の形を判別しないことである。したがって移動物体 2の密度が高くなると、異なる移動物体 2から生成された形成エッジ情報 1 1 4が組み合わさって、存在していない物体のエツジ情報と混同してしまう場合がある。この問題を解決するためには形成エッジ情報 1 1 4 から移動物体 2の形を判別すればよい訳だが、従来の幾何解析方法では大域処理となるために計算量が多くなり、判別結果の精度を上げると計算時間が指数関数的に長くなる。そこで近傍処理によりこの問題を解決する手段として、物体 Z背景分離手段 1 6 (第 2図参照）を用いることができる。

物体/背景分離手段 1 6はエッジ情報形成手段 1 5から形成エッジ情報画像 1 1 5を入力すると、物体領域 1 4 1に含まれる画素と背景に含まれる画素を異なるグループに分離して、分離結果をグループ単位で順次出力する。なお物体領域 1 4 1が隣接しているにも関わらず形成エッジ情報 1 1 4により明確に区別される場合、物体 Z背景分離手段 1 6はこれらの物体領域を異なるグループに分離することができる。したがってグループの数は 3以上になることもある。物体/背景分離手段 1 6は画素毎に近傍処理のみで物体領域 1 4 1と背景を分離することができるので、並列化に向いている。もし物体 Z背景分離手段 1 6が物体領域画像 1 4 2の全ての画素を並列に出力することができれば、物体背景分離手段 1 6から位置大きさ検出手段 1 7への通信は、画素毎に並列に行うことができる。

そこで第 2図に示すように、物体背景分離手段 1 6を用いることで、近傍処理のみで形成エッジ情報 1 1 4を補完しながら移動物体 2の領域とその他の背景領域を分離することができる。このとき移動物体 2の領域が円形に類似していれば、言い換えれば移動物体 2の領域に凹凸が少なければ、位置大きさ検出手段 1 7は一定の大きさの領域のみを抜き出して位置を特定することができる。したがつて移動物体 2が円形に類似していることが事前に判っていれば、物体/背景分離手段 1 6を用いることで画素計数手段 1 8は特定の大きさの移動物体 2の領域の位置を表す画素の数を数えることができる。つまり移動物体計数部 1 0 1はより精度の高い移動物体数を出力することができる。

ここまでは動画像の 2つ以上のフレーム画像 1中の移動物体 2の数を数える際に、移動物体計数部 1 0 1がどのように動作するのかを説明してきた。次に動画像の 1つのフレーム画像 1中の移動物体 2と静止物体 3の総数、つまり全物体数を数える場合を説明する。まず基本的な動作は前述した動画像のフレーム画像 1を用いた移動物体 2の数を数える場合と同じである。つまりフレーム画像 1中の静止物体 3を適当な方法で見かけ上フレーム画像 1中の移動物体 2に置き換えてしまえば良い。そうなれば静止物体 3の粗エツジ情報 1 1 2が生成されるので、移動物体計数部 1 0 1は静止物体 3の数も数えることができる。静止物体 3を移動物体 2に見せ掛ける方法として最も簡単なものが、振動台などを用いてビデオカメラ（デジタルカメラ）、若しくは静止物体 3自体を細かく振動させることである。しかしながらこれらの方法は物理的な機構を必要とするため、移動物体計数部 1 0 1が高価になったり複雑になったりする。一方で物理的な機構を利用しない手段として画像振動手段 1 3 (第 3図参照）がある。

画像振動手段 1 3は画像取得手段 1 1からデジタル画像 1 1 1を入力すると、デジタル画像 1 1 1中で静止物体 3が 3画素前後の範囲で上下左右に振動するように、画像単位で一斉に、又は画素単位で個別に移動する。もし画像振動手段 1 3がデジタル画像 1 1 1の全ての画素を並列に出力することができれば、画像振動手段 1 3からエッジ情報生成手段 1 4への通信は、画素毎に並列に行うことができる。

そこで第 3図に示すように、画像振動手段 1 3は、画像取得手段 1 1で生成されたデジタル画像 1 1 1中の静止物体 3を 3画素前後の範囲で上下左右に振動させる。これによりエッジ情報生成手段 1 4は静止物体 3を移動物体 2と見なして、静止物体 3の粗エッジ情報 1 1 2を生成することができるので、全物体計数部 1 0 2は移動物体 2と静止物体 3の総数、つまり全物体数を数えることができる。

さらに移動物体 2と静止物体 3の如何に関わらず、物体 Z背景分離手段 1 6は形成エツジ情報 1 1 4のみによって物体領域 1 4 1と背景領域を分離する。そこで移動物体 2及び静止物体 3が円形に類似していることが事前に判っていれば、第 4図に示すように、エツジ情報形成手段 1 5が生成した形成エッジ情報画像 1 1 5を物体背景分離手段 1 6に入力し、物体 Z背景分離手段 1 6が生成した物体領域画像 1 4 2を位置/大きさ検出手段 1 7に入力することにより、位置/大きさ検出手段 1 7は特定の大きさの移動物体 2及び静止物体 3の領域の位置を表す画素の数を数えることができる。つまり全物体計数部 1 0 2 はより精度の高い全物体数を出力することができる。

さて、ここまで記述してきたように、視覚装置は動画像中の移動物体 2の数を数える移動物体計数部 1 0 1と殆ど同じ手段を備えた全物体計数部 1 0 2を用いて、動画像のフレーム画像 1中の移動物体 2と静止物体 3の総数を数えることができる。そこで 1つの視覚装置を用いて移動物体 2と静止物体 3の数を並列に数える方法を考える。このとき移動物体 2と静止物体 3の数が求まるのならば、全物体に対する移動物体 2の割合、又は静止物体 3の割合を計算することは非常に容易である。そこで移動物体 2と静止物体 3の割合を求めるための視覚装置についても説明する。

移動物体 2と全物体の数を求め、かつ移動物体 2と静止物体 3の割合を求める視覚装置の全体的な構成は、第 5図に示す通り、大きく分けて移動物体計数部 1 0 1と全物体計数部 1 0 2からなる。移動物体計数部 1 0 1と全物体計数部 1 0 2は各々前述の手段から構成されている。なお移動物体計数部 1 0 1と全物体計数部 1 0 2の画像取得手段 1 1及び画像記憶手段 1 2は全く同じ動作をするので、第 5図では画像取得手段 1 1及び画像記憶手段 1 2を共有している。したがって重要なことは、移動物体計数部 1 0 1の画素数保持手段 1 9が全物体計数部 1 0 2の画素計数手段 1 8から全物体数を入力し、全物体計数部 1 0 2の画素数保持手段 1 9が移動物体計数部 1 0 1の画素計数手段 1 8から移動物体数を入力することで、割合切替信号など外部からの信号により移動物体 2と静止物体 3の割合を計算して浮動小数点表記などに変換するよう切り替えられることである。当然の事ながら移動物体 2と静止物体 3の割合を計算する必要がないか、又は別の装置により実現するならば、このような機能を画素数保持手段 1 9に加える必要はない。逆に、移動物体数と静止物体数を同時に求める場合には、対応する機能を画素数保持手段 1 9に追加すれば良い。画素数保持手段 1 9に汎用プロセッサを用いることにより、視覚装置は用途に応じてこのような変更を自由に行うことができる。

さて、ここまで説明してきたように、移動物体計数部 1 0 1及び全物体計数部 1 0 2から構成される、請求項 1から請求項 3までに記載された視覚装置は、ビデオカメラで撮影されたフレーム画像 1中の移動物体 2及び静止物体 3の数を数えるための装置である。したがつて移動物体 2及び静止物体 3がフレーム画像 1に収まつていれば、これらの視覚装置は移動物体 2及び静止物体 3の数を数えることができる。しかしながら一旦移動物体 2 及び静止物体 3がフレーム画像 1から外れてしまうとこれらの視覚装置は移動物体 2及び静止物体 3の数を数えることができなくなってしまう。そこで以下では、移動カメラ 1 0 (第 6図参照）を用いて、常時移動物体 2及び静止物体 3を探索しながら数を数える、請求項 4及び請求項 5記載の視覚装置について説明する。

まず移動カメラ 1 0は水平方向及び垂直方向に移動する機構を備え、外部から移動角度を制御する命令を入力することにより、各々パン及びチルトをすることができるものとする。また移動カメラ 1 0は撮影画像の倍率を変更する機構を備え、外部から倍率を制御する命令を入力することにより、ズームをすることができるものとする。したがって移動力メラ 1 0は外部からの命令によりカメラ自体を細かく振動させることができる。これにより移動カメラ 1 0が撮影した動画像のフレーム画像 1はブレを生じ、フレーム画像 1中の物体はあたかも振動しているように撮影される。つまり移動カメラ 1 0を用いると、全物体計数部 1 0 2の画像振動手段 1 3を用いることなく移動物体計数部 1 0 1のみで全物体の領域を数えることができる。この方法は移動カメラ 1 0の物理的機構を使うために処理速度や計数精度などの点で問題もあるが、移動物体計数部 1 0 1のみで移動物体 2と全物体の両方の領域を数えることができるため、フレーム画像 1では収まりきらないような広い場所にある移動物体 2及び静止物体 3を数える用途には向いている。

ここで移動カメラ 1 0はパン、チルト及びズームなどの移動命令により移動した現在の位置を必要に応じて出力できるものとし、さらに現在移動中であるか若しくは停止しているかといった移動カメラ 1 0の状態も必要に応じて出力できるものとする。このとき、もし視覚装置が移動カメラ 1 0のパン、チルト及びズームを制御することができれば、この視覚装置は、移動力メラ 1 0が移動物体 2及び静止物体 3を常時適切な大きさで撮影できるように、移動カメラ 1 0の向き及び倍率を変更することができるようになる。

そこで移動カメラ 1 0が移動物体 2及び静止物体 3を常時適切な大きさで撮影するための基本的な手段を備えた請求項 4記載の視覚装置を第 6図に示す。このとき視覚装置は機能に応じて 3つの座標系、つまりカメラ座標系、画像座標系及び環境座標系を用いている。第一に、カメラ座標系は、文字通り移動カメラがパン、チルト及びズームを各々の最小制御単位で制御するために用いているカメラ内部の三次元球座標系である。一般に力メラ座標系の原点はホームポジションと呼ばれる移動カメラ固有の位置である。カメラ座標系は移動物体 2及び静止物体 3の物理的位置を表すことができる唯一の座標系である。それにも関わらずカメラ座標系は移動カメラ 1 0の機種毎に異なるため汎用性がない。そのため視覚装置は他の手段からカメラ座標系を秘匿する必要がある。第二に、画像座標系は、移動カメラ 1 0によって撮影されたフレーム画像 1の中央を原点とする、画素を単位とした二次元座標系である。これはフレーム画像 1中のどの画素に移動物体 2及び静止物体 3が位置するか表すために用いられる。したがって画像座標系はフレーム画像 1中にある複数の物体の細かな位置を区別するのには適しているが、画像座標系だけでは移動物体 2及び静止物体 3の物理的位置を表すことができない。第三に、環境座標系は、視覚装置が内部で移動物体 2及び静止物体 3の位置を論理的に統一して表すために用いている三次元球座標系である。環境座標系は水平方向及び垂直方向にはラジアンを単位とした角度を用い、物体の大きさと物体までの距離の積を表すために、距離方向には 1 . 0を単位とした実数を用いる。一般に物体の大きさが極端に変ることはないので、物体までの距離と移動力メラ 1 0の倍率は比例すると見なして良い。環境座標系の原点は任意である。つまり環境座標系は原則として環境座標系上の任意の 2点の相対座標を表すために用いられる。視覚装置は移動カメラ 1 0によって撮影可能な環境中の物体を環境座標系に投影することで、複数の物体を区別することができる。

したがってカメラ座標系及び画像座標系は各々環境座標系と相互に座標変換をする必要がある。その役割を果たしている手段がカメラ/環境座標変換手段 2 0、画像環境座標変換手段 2 1及び運動制御手段 2 3である。これらの手段は移動力メラ 1 0及び画像取得手段 1 1の仕様からカメラ座標系及び画像座標系の各単位を求め、環境座標系に変換するための行列を計算する。またカメラ座標系から環境座標系への変換行列の逆行列を計算することにより、環境座標系からカメラ座標系への変換行列も求めることができる。ただしカメラ座標系の原点が移動カメラ 1 0のホームポジションであるので、カメラ座標系から変換された環境座標系の位置は環境座標系上の移動カメラ 1 0のホームポジションからの相対位置となる。一方、環境座標系から変換されたカメラ座標系の位置はカメラ座標系上の移動カメラ 1 0の現在位置からの相対位置となる。加えて、画像座標系は二次元座標系であるため、画像座標系のみでは環境座標系に変換することはできない。そのため画像環境座標変換手段 2 1では環境座標系で表された移動カメラ 1 0の向き及び倍率と、フレーム画像 1中の移動物体 2及び静止物体 3の領域の大きさを用いて、随時変換行列を計算することにより、画像座標系から環境座標系に変換できるようにする。なお画像座標系から変換された環境座標系の位置は、画像の中心からの相対位置となる。

このことより、請求項 4記載の視覚装置の残りの手段は、移動物体 2及び静止物体 3を常時適切な大きさで撮影するために、これら 3つの座標系で表された移動物体 2及び静止物体 3の位置を生成及び変換するための手段であると考えることができる。そこでカメラ座標系、画像座標系及び環境座標系を踏まえて第 6図を説明する。

まず画像取得手段 1 1、エッジ情報生成手段 1 4及び位置大きさ検出手段 1 7は移動物体計数部 1 0 1及び全物体計数部 1 0 2から構成される請求項 1から請求項 3までに記載された視覚装置で説明したものと同じである。ただし請求項 1から請求項 3までに記載された視覚装置では、エッジ情報形成手段 1 5が生成した形成エッジ情報画像 1 1 5を位置ノ大きさ検出手段 1 7に入力していたが、請求項 4記載の視覚装置では、エッジ情報生成手段 1 4が生成した粗エッジ情報画像 1 1 3を位置ノ大きさ検出手段 1 7に入力している。勿論この視覚装置において、エッジ情報形成手段 1 5を用いることにより形成エッジ情報画像 1 1 5を位置大きさ検出手段 1 7に入力することも可能であるが、ここでは以下のような理由によりこの視覚装置の性能はエッジ情報形成手段 1 5を用いなくても十分である。第一に、この視覚装置には、請求項 1から請求項 3までに記載された視覚装置に求められたように移動物体 2及び静止物体 3の領域の数を数える必要がない。むしろこの視覚装置は移動物体 2及び静止物体 3を探索して、その方向に移動カメラ 1 0の向きと倍率を合わせることが重要である。しかも位置 Z大きさ検出手段 1 7は粗エッジ情報 1 1 2 からでも移動物体 2及び静止物体 3の領域のおおよその大きさを求めることは可能である。第二に、ェッジ情報形成手段 1 5はェッジ情報生成手段 1 4が生成した粗ェッジ情報画像 1 1 3を用いて形成エッジ情報画像 1 1 5を生成する。つまりエッジ情報形成手段 1 5が形成エッジ情報画像 1 1 5を生成している間に移動物体 2が移動してしまう。一般に移動カメラ 1 0は物理的な機構を有しているため移動カメラ 1 0の移動速度はあまり速くないと考えられる。そこでこの視覚装置が移動カメラ 1 0を移動させると、移動物体 2 の移動速度によっては移動カメラ 1 0の制御が間に合わなくなる可能性がある。これらのことより、請求項 4記載の視覚装置は移動物体 2及び静止物体 3の的確で明瞭な形成ェッジ情報 1 1 4を必ずしも必要としない。

次に、力メラノ環境座標変換手段 2 0及び画像 Z環境座標変換手段 2 1は、位置,大きさ検出手段 1 7が生成した重複情報画像 1 3 2で表される移動物体 2及び静止物体 3の領域の位置を環境座標系の位置に変換する。このときフレーム画像 1中の移動物体 2及び静止物体 3の領域の位置の総数が 2以上であれば、環境座標系上にも 2つ以上の位置が存在することになる。そこで移動カメラ 1 0のパン、チルト及びズームを制御していずれか 1つの物体に移動カメラ 1 0の向き及び倍率を合わせるために、環境座標系上の位置の中から 1つを選択する必要がある。位置選択手段 2 2は一定の判断基準に従い、環境座標系上の 1つの位置を選択する。ここで用いられる判断基準は主に次のようなものである。第一に、環境座標系上で物体が最も近いもの（若しくは最も大きいもの）を選択する。これは物体が遠かったり（若しくは小さかったり）した場合、エッジ情報生成手段 1 4がノィズを生成した可能性があるので、少しでも環境座標系上の位置に物体がある確率が高いものを選択する。第二に、環境座標系上の一定範囲内に複数の位置が集中している場合、このうちの 1つを選択する。これは 2つの可能性が考えられる。 1つはエッジ情報生成手段 1 4が 1つの物体に対して分散した粗エッジ情報 1 1 2を生成した可能性であり、もう 1 つは実際に複数の物体が存在する可能性である。第三に、環境座標系上に多数の位置がほぼ同じ距離（若しくはほぼ同じ大きさ）である場合、原点に最も近い位置、すなわち移動カメラ 1 0の向きに最も近い位置を選択する。これらを用途や状況に応じて適宜組み合せることにより、位置選択手段 2 2は環境座標系上の 1つの位置を選択することができる。さて、請求項 4記載の視覚装置は、位置選択手段 2 2で選択された位置の他に次のような位置に移動カメラ 1 0をパン、チルト及びズームすることが求められる。まずこの視覚装置は移動カメラ 1 0を振動させなければならない。そこで移動カメラ 1 0を振動させるために振動命令生成手段 2 5は移動カメラ 1 0が移動する位置を環境座標系上の位置として指定する。振動命令生成手段 2 5が指定する位置は極端に移動カメラ 1 0が振動しない範囲で疑似乱数などによって決定する。加えて、請求項 4記載の視覚装置は、外部から制御命令を入力することにより移動カメラ 1 0をパン、チルト及びズームすることが求められる。一般的な用途では移動カメラ 1 0が現在向いている向きや倍率に対してパン、チルト及びズームがなされるので、制御命令入力手段 2 4を用いて、一旦制御命令を記憶した後に移動カメラ 1 0の現在位置を原点とした環境座標系上の位置を算出する。なお制御命令入力手段 2 4を改良することにより、移動カメラ 1 0を特定の位置に移動させることは容易に可能である。

そこで移動カメラ 1 0のパン、チルト及びズームを制御するために、運動制御手段 2 3 が前述した環境座標系上の 3つの位置から 1つを選択する。運動制御手段 2 3が 3つの位置から 1つを選択する際には、制御命令入力手段 2 4、位置選択手段 2 2、振動命令生成手段 2 5の順番で入力位置がある手段から選択する。選択された位置は環境座標系から力メラ座標系に変換される。その後カメラ命令生成手段 2 6によって移動カメラ 1 0が認識することができる命令に置き換えられて移動カメラ 1 0に送信される。これにより請求項 4記載の視覚装置は移動カメラ 1 0のパン、チルト及びズームを制御することができる。なお移動カメラ 1 0の機種によっては移動カメラ 1 0に特定の命令を送信しないと移動カメラ 1 0の状態、すなわち移動カメラ 1 0の向き及び倍率や、移動カメラ 1 0が移動中か停止中かといつた情報を得ることができない。そこで運動制御手段 2 3は 3つの位置から 1つを選んでカメラ命令生成手段 2 6に出力した後に、移動カメラ 1 0が移動中かどうかといつた情報を問い合わせる命令を移動カメラ 1 0に送信するように、カメラ命令生成手段 2 6に指示し、移動カメラ 1 0からカメラ Z環境座標変換手段 2 0を介してこの情報を受け取るまで待つ。もし受け取った情報が移動中であれば、移動カメラ 1 0が移動中かどうかといった情報を問い合わせる命令を移動カメラ 1 0に送信するように、再度カメラ命令生成手段 2 6に指示する。もし受け取った情報が停止中であれば、移動カメラ 1 0が現在の向き及び倍率を問い合わせる命令を移動カメラ 1 0に送信するように、カメラ命令生成手段 2 6に指示する。この期間中運動制御手段 2 3は 3つの位置を選択しない。カメラ命令生成手段 2 6は運動制御手段 2 3からの指示に従い、対応する命令を移動カメラ 1 0に送信する。カメラ/環境座標変換手段 2 0は移動カメラ 1 0が移動中かどうかといつた情報をそのまま運動制御手段 2 3に送信し、また移動カメラ 1 0の現在の向き及び倍率をカメラ座標系から環境座標系の位置に変換する。これにより請求項 4記載の視覚装置は、移動カメラ 1 0の状態を逐次調査しながら、移動カメラ 1 0のパン、チルト及びズ一ムを制御することができる。

ここまでは、移動カメラ 1 0がフレーム画像 1中の移動物体 2及び静止物体 3を常時適切な大きさで撮影するための基本的な手段を備えた請求項 4記載の視覚装置について説明してきた。しかしながら移動カメラ 1 0が撮影している範囲に移動物体 2及び静止物体 3が常に存在するとは限らないし、何より移動物体 2は移動カメラ 1 0が撮影している範囲からやがて他の位置に移動してしまうと考えるのが自然である。勿論移動物体 2が移動すると、移動カメラ 1 0から見える移動物体 2の形及び色も当然変化すると考えられる。そこで以下で説明する請求項 5記載の視覚装置は、請求項 4記載の視覚装置に対して、フレーム画像 1中の移動物体 2及び静止物体 3の形及び色をより正確に認識するための幾つかの手段と、移動カメラ 1 0がー定時間内に撮影した移動物体 2及び静止物体 3の数をより正確に数えるための幾つかの手段と、移動カメラ 1 0が撮影可能な範囲にある移動物体 2及び静止物体 3の位置に向けてより正確に移動カメラ 1 0を移動させるための手段と、を追加したものであると見なすことができる。

第 7図の視覚装置は、請求項 4記載の視覚装置に対してエッジ情報形成手段 1 5、物体 Z背景分離手段 1 6、領域正規化手段 2 7及び正規化画像保持手段 2 8を追加することにより正規化画像 1 4 5を生成するものである。エッジ情報形成手段 1 5及び物体 Z背景分離手段 1 6は、移動物体計数部 1 0 1及び全物体計数部 1 0 2から構成される請求項 1から請求項 3までに記載された視覚装置のエッジ情報形成手段 1 5及び物体 Z背景分離手段 1 6と同じものである。領域正規化手段 2 7は物体背景分離手段 1 6及び画像取得手段 1 1から物体領域画像 1 4 2及びデジタル画像 1 1 1をそれぞれ入力すると、分離物体領域 1 4 3をデジ夕ル画像 1 1 1から切り出し、分離物体領域 1 4 3を変形しながらデジタル画像 1 1 1の画像サイズに合わせて可能な限り補完及び拡大することで正規化画像 1 4 5を生成する。領域正規化手段 2 7は画素毎に近傍処理のみで分離物体領域 1 4 3を正規化することができるので、並列化に向いている。もし領域正規化手段 2 7が正規化画像 1 4 5の全ての画素を並列に出力することができれば、領域正規化手段 2 7から正規化画像保持手段 2 8 への通信は、画素毎に並列に行うことができる。

正規化画像保持手段 2 8は領域正規化手段 2 7から正規化画像 1 4 5を入力すると、もし正規化画像 1 4 5の出力先が適当なフォーマットの正規化画像 1 4 5を要求するならば、正規化画像 1 4 5の出力先が要求するフォーマットに正規化画像 1 4 5を変換する。その後正規化画像保持手段 2 8は正規化画像 1 4 5の出力先に確実に正規化画像 1 4 5 を送信するまで一定期間正規化画像 1 4 5を記憶する。正規化画像保持手段 2 8は変換するフォーマツトを限定すれば画素毎に近傍処理のみで正規化画像 1 4 5を変換することができるので、並列化に向いている。もし正規化画像保持手段 2 8が正規化画像 1 4 5の全ての画素を並列に出力することができれば、正規化画像保持手段 2 8から正規化画像 1 4 5の出力先への通信は、画素毎に並列に行うことができる。

したがってエッジ情報形成手段 1 5、物体/背景分離手段 1 6、領域正規化手段 2 7及び正規化画像保持手段 2 8を用いることにより、たとえ請求項 4記載の視覚装置が撮影した移動物体 2及び静止物体 3がフレーム画像 1中の任意の位置に任意の大きさで存在しても、第 7図の視覚装置はできる限り類似した移動物体 2及び静止物体 3の正規化画像 1 4 5を生成することができる。これにより、正規化画像 1 4 5の出力先が移動物体 2及び静止物体 3を認識する必要がある場合、正規化画像 1 4 5の出力先はフレーム画像 1中の移動物体 2及び静止物体 3の位置及び大きさをあまり考慮することなく適切な認識方法を用いることができるようになる。

なお第 7図の視覚装置では、エッジ情報生成手段 1 4と、エッジ情報形成手段 1 5、物体/背景分離手段 1 6、領域正規化手段 2 7及び正規化画像保持手段 2 8との間で、各々の手段が入力する画像の解像度若しくは画像サイズを必ずしも一致させる必要はない。例えば、第 7図の視覚装置において、エッジ情報生成手段 1 4にはデジタル画像 1 1 1の解像度を低くした低解像度デジタル画像 1 1 6を入力させ、一方、エッジ情報形成手段 1 5 には、エッジ情報生成手段 1 4が生成した低解像度粗エッジ情報画像 1 1 7の画像サイズを適当な方法でデジタル画像 1 1 1の画像サイズに拡大した粗エッジ情報画像 1 1 3を入力させ、物体 Z背景分離手段 1 6及び領域正規化手段 2 7にはデジタル画像 1 1 1を入力させることにより、エッジ情報生成手段 1 4の負荷を低減することができる。つまりエッジ情報形成手段 1 5以降で生成される正規化画像 1 4 5の品質をほとんど変えることなく、位置/大きさ検出手段 1 7以降の移動カメラ 1 0のパン、チルト及びズームの制御をより高速にすることができる。そこでこの方法をさらに進めると、エッジ情報形成手段 1 5には、エッジ情報生成手段 1 4が生成した低解像度粗エッジ情報画像 1 1 7のうち粗エッジ情報 1 1 2が存在する領域を切り出した切出粗エッジ情報画像 1 1 9を入力させ、物体ノ背景分離手段 1 6及び領域正規化手段 2 7には、デジタル画像 1 1 1から切出粗エッジ情報画像 1 1 9と同じ位置の領域を切り出した切出デジタル画像 1 2 0を入力させることにより、エッジ情報形成手段 1 5以降の正規化画像 1 4 5の生成の負荷を低減することができる。ここで請求項 4記載の視覚装置により、移動カメラ 1 0が移動物体 2及び静止物体 3をフレーム画像 1の中央に適切な大きさで撮影することができれば、デジタル画像 1 1 1に対する切出粗エッジ情報画像 1 1 9及び切出デジタル画像 1 2 0の切出領域を事前に決定することができる。この方法により、第 7図の視覚装置は 1台の移動カメラ 1 0を用いることにより、広角カメラと高解像度カメラを用いた物体探索装置と同様の性能を達成することができる。

第 8図の視覚装置は、第 7図の視覚装置に対して画像認識手段 2 9及び認識結果保持手段 3 0を追加することにより認識結果を生成するものである。

画像認識手段 2 9は領域正規化手段 2 7から正規化画像 1 4 5を入力すると、正規化画像 1 4 5中の移動物体 2及び静止物体 3の正規化領域 1 4 4を適当なパターン認識方法を用いて認識し、認識結果を出力する。画像認識手段 2 9に入力される正規化画像 1.4 5は領域正規化手段 2 7によつて移動物体 2及び静止物体 3の形を変形されているので、画像認識手段 2 9はストローク抽出法、フーリエ変換及びハフ変換など位置ずれに強い方法を用いた幾何解析を行うよりも、むしろ入力画像とテンプレート画像の比較をするパターンマッチングを行う方が適している。パターンマッチング法としては、誤差逆伝播法 (バックプロパゲ一シヨン）によりテンプレート画像を学習することができるパーセプトロンなどのニューラルネットワークを用いることができる。またニューラルネットワークを用いた場合には、ニューラルネットワーク専用ァクセラレ一夕を用いることにより並列化及び高速化も可能である。正規化画像 1 4 5の認識結果は画像認識手段 2 9から認識結果保持手段 3 0へ出力される。

認識結果保持手段 3 0が画像認識手段 2 9から正規化画像 1 4 5の認識結果を入力すると、もし認識結果の出力先が適当なフォーマットの信号を要求するならば、認識結果の出力先が要求するフォーマットに認識結果を変換する。その後認識結果保持手段 3 0は認識結果の出力先に確実に認識結果を送信するまで一定期間認識結果を記憶する。

したがって画像認識手段 2 9及び認識結果保持手段 3 0を用いることにより、第 8図の視覚装置は移動力メラ 1 0が適当な大きさで撮影した移動物体 2及び静止物体 3の認識結果を生成することができる。これにより認識結果の出力先は、移動カメラ 1 0が撮影した移動物体 2及び静止物体 3の認識装置として第 8図の視覚装置を利用することができる。第 9図の視覚装置は、第 8図の視覚装置に対して環境理解手段 3 1、計時手段 3 2及び環境地図保持手段 3 3を追加することにより環境地図を生成するものである。

計時手段 3 2はタイマー回路により現在時刻を 1ミリ秒単位で出力する。現在時刻は絶えず計時手段 3 2から環境理解手段 3 1へ出力される。

環境理解手段 3 1は画像認識手段 2 9から移動物体 2及び静止物体 3の認識結果を入力すると、認識結果、移動カメラ 1 0の環境座標系上での位置及び現在時刻からなる環境データを作成する。また環境理解手段 3 1は画像 Z環境座標変換手段 2 1からフレーム画像 1中の全ての移動物体 2及び静止物体 3の領域の環境座標系上での位置を入力すると、ヌルデ一夕からなる認識結果、移動カメラ 1 0の環境座標系上での位置とフレーム画像 1中の 1つの移動物体 2及び静止物体 3の領域の環境座標系上での位置を加えた位置、及び現在時刻からなる環境デ一夕を、移動物体 2及び静止物体 3の領域の数だけ作成する。このとき環境地図は現在時刻より一定時間前に作成された環境データの集合となり、環境データ中の位置は移動カメラ 1 0のホームポジションを原点とする環境座標系によつて表される。環境理解手段 3 1は環境地図に対して時刻の経過と共に環境デ一夕を追加及び削除する。また環境理解手段 3 1は重複した内容の環境データを削除すると共に、認識結果がヌルデータである環境デ一夕中の位置が認識結果がヌルデータでない他の環境データ中の位置の近傍である場合、認識結果がヌルデ一夕である環境データを削除する。加えて、認識結果がヌルデータでない環境デ一夕中の位置が、認識結果がヌルデ一夕でない他の環境デ一夕中の位置の近傍である場合、もしこれらの環境データ中の認識結果が一致すれば、前者の環境データを削除する。環境データの記録時間と環境デ一夕中の位置の近傍の範囲により、環境地図の精度が決定される。環境地図は環境理解手段 3 1から環境地図保持手段 3 3へ出力される。

環境地図保持手段 3 3が環境理解手段 3 1から環境地図を入力すると、もし環境地図の出力先が適当なフォーマットの信号を要求するならば、環境地図の出力先が要求するフォーマットに環境地図を変換する。その後環境地図保持手段 3 3は環境地図の出力先に確実に環境地図を送信するまで一定期間環境地図を記憶する。

したがって環境理解手段 3 1、計時手段 3 2及び環境地図保持手段 3 3を用いることにより、第 9図の視覚装置は移動力メラ 1 0が撮影した移動物体 2及び静止物体 3の位置を特定することができる。これにより環境地図の出力先は、移動カメラ 1 0が撮影可能な移動物体 2及び静止物体 3の位置を特定する装置として第 9図の視覚装置を利用することができる。

第 1 0図の視覚装置は、第 9図の視覚装置に対して物体位置推定手段 3 4を追加することにより物体の推定位置に移動カメラ 1 0を制御するものである。

物体位置推定手段 3 4は環境理解手段 3 1から環境地図を入力すると、認識結果がヌルデータである環境デ一夕を 1つ選択し、この環境データ中の位置を抜き出す。この位置からカメラ/環境座標変換手段 2 0によって計算された移動カメラ 1 0の環境座標系上での現在位置を引くことにより、物体位置推定手段 3 4は、移動カメラ 1 0の環境座標系上での現在位置を原点とした、過去に粗エッジ情報 1 1 2が生成されているにも関わらずまだ認識結果が出ていない移動物体 2及び静止物体 3の環境座標系上での相対位置を求めることができる。ただし移動物体 2の場合、現在この位置に移動物体 2が存在するとは限らなレ^ したがってこの位置は移動物体 2及び静止物体 3が存在する可能性がある移動物体 2 及び静止物体 3の推定位置となる。一方で、もし環境地図の中に認識結果がヌルデータである環境データがなければ、移動カメラ 1 0が移動可能な範囲で適当な環境座標系上の位置を生成する。このとき適当な位置を生成する基準として次のようなものが考えられる。第一に、疑似乱数により任意の位置を生成する。第二に、環境地図中の環境データ中の位置の密度が低い位置を計算する。第三に、移動カメラ 1 0が移動可能な範囲中の位置を適当な順番で順次生成する。例えば、移動カメラ 1 0が移動可能な範囲において左上端の位置から右に向けて順番に位置を生成し、右端に到達したら一段下に降りた後左に向けて順番に位置を生成し、左端に到達したら一段下に降りた後右に向けて順番に位置を生成することを繰り返す。これらの基準を用途や状況に応じて組み合せることにより、まだ移動力メラ 1 0が撮影していない移動物体 2及び静止物体 3の推定位置を効率的に推定することができる。物体推定位置は物体位置推定手段 3 4から運動制御手段 2 3へ出力される。ここで運動制御手段 2 3は、請求項 4記載の視覚装置における運動制御手段 2 3を基にして次のように変更される。つまり移動カメラ 1 0のパン、チルト及びズームを制御するために、運動制御手段 2 3は制御命令入力手段 2 4、物体位置推定手段 3 4、位置選択手段 2 2及び振動命令生成手段 2 5の順番で入力位置がある手段から選択する。ただし運動制御手段 2 3は物体位置推定手段 3 4からの入力位置を連続して選択しないようにする必要がある。

したがって物体位置推定手段 3 4を用いることにより、第 1 0図の視覚装置は移動カメラ 1 0が撮影可能な範囲に存在する移動物体 2及び静止物体 3を探索することができる。これにより環境地図の出力先は、移動カメラ 1 0が撮影可能な移動物体 2及び静止物体 3 の位置を特定する装置として第 1 0図の視覚装置を利用することができる。

第 1 1図の視覚装置は、第 1 0図の視覚装置に対して物体計数手段 3 5及び物体数保持手段 3 6を追加することにより任意物体数を生成するものである。

物体計数手段 3 5は環境理解手段 3 1から環境地図を入力すると、環境地図中、特定の物体を意味する認識結果を有する環境データの数を数えて、任意物体数を生成する。環境データ中の認識結果は、画像認識手段 2 9によって識別される物体の種類の中からいくつでも選択できる。任意物体数は物体計数手段 3 5から物体数保持手段 3 6へ出力される。なお用途に応じて必要があれば、物体計数手段 3 5を変更することにより、外部から計数すべき物体の種類を指定できるようにすることは容易である。

物体数保持手段 3 6が物体計数手段 3 5から任意物体数を入力すると、任意物体数の出力先に確実に任意物体数を送信するまで一定期間任意物体数を記憶する。

したがって物体計数手段 3 5及び物体数保持手段 3 6を用いることにより、第 1 1図の視覚装置は移動カメラ 1 0が撮影可能な範囲に存在する特定の移動物体 2及び静止物体 3の数を数えることができる。これにより任意物体数の出力先は、移動カメラ 1 0が撮影可能な特定の移動物体 2及び静止物体 3の数を数える装置として第 1 1図の視覚装置を利用することができる。

第 1 2図に示すように、請求項 5記載の視覚装置は、第 1 1図の視覚装置に対して幾何解析手段 3 7を追加することにより環境地図の作成を的確で高速にするものである。幾何解析手段 3 7はエッジ情報形成手段 1 5から形成エッジ情報画像 1 1 5を入力すると、ストローク抽出法、フーリエ変換及びハフ変換などの幾何解析を行うことにより、フレーム画像 1中の移動物体 2及び静止物体 3の形を推定し、幾何解析結果を生成する。従来の画像認識では画像自体から直接線分などを抽出したり位置や大きさなどに左右されないような各種変換などを用いることにより、画像中の物体を認識することを行ってきた。このため処理の単純さにも関わらず組み合わせの数が膨大となり、結果として膨大な計算量が必要となり、望みうる結果を得るまでに長時間掛つたり、若しくは品質の低い認識結果しか得られなかった。しかしながら請求項 5記載の視覚装置では、フレーム画像— 1 中の移動物体 2及び静止物体 3のパターンに対する認識を物体背景分離手段 1 6、領域正規化手段 2 7及び画像認識手段 2 9が行う。そこで、幾何解析手段 3 7は形成エッジ情報画像 1 1 5を用いて、物体背景分離手段 1 6、領域正規化手段 2 7及び画像認識手段 2 9が苦手としている移動物体 2及び静止物体 3の輪郭などの図形のみを、簡単な方法で大ざっぱに解析することにより、画像認識手段 2 9が不必要なパターンマッチングを省略し、環境理解手段 3 1が環境地図を的確で高速に作成することができると共に、幾何解析手段 3 7自体の負荷も低減することができる。幾何解析結果は幾何解析手段 3 7から画像認識手段 2 9及び環境理解手段 3 1へ出力される。そのため画像認識手段 2 9及び環境理解手段 3 1は各々次のように動作する。

画像認識手段 2 9は幾何解析手段 3 7から幾何解析結果を入力すると、まず画像認識手段 2 9が認識の対象としている図形であるかどうか判断する。もし幾何解析結果が対象外の図形であれば、画像認識手段 2 9は動作しない。幾何解析結果が対象図形であれば、画像認識手段 2 9は対象図形用のテンプレート画像を用いてパターンマッチングを行う。例えば誤差逆伝播法によって学習するパーセプトロンの場合、対象図形毎にパーセプトロンを学習させて学習デ一夕を作成し、その後幾何解析艢果によって学習データを選択することにより、対象図形に対して効率的にパターンマッチングを行うようにする。つまり幾何解析結果が円形であれば，人の顔ゃボルなど円形の物体の学習データだけを利用し、幾何解析結果が三角形であれば、道路標識や山並みなど三角形の物体の学習デ一夕だけを利用する。これならば小規模のパーセプトロンによって多数の物体のパターンを認識することができるばかりでなく、パーセプトロン自体も効率よく学習することができる。環境理解手段 3 1は幾何解析手段 3 7から幾何解析結果を入力すると、まず画像認識手段 2 9が認識の対象としている図形であるかどうか判断する。もし幾何解析結果が対象外の図形であれば、移動カメラ 1 0の環境座標系上の位置の近傍にある、認識結果がヌルデータである環境デ一夕を、環境理解手段 3 1は直ちに環境地図から削除する。これにより環境地図から不必要な環境データが削除され、物体位置推定手段 3 4などが不必要な物体推定位置を出力しなくても済む。幾何解析結果が対象図形の場合、画像認識手段 2 9から認識結果が入力されるまで待つ。

したがって幾何解析手段 3 7を用いることにより、請求項 5記載の視覚装置は移動カメラ 1 0が撮影可能な範囲に存在する特定の移動物体 2及び静止物体 3の数を的確で高速に数えることができる。これにより任意物体数の出力先は、移動カメラ 1 0が撮影可能な特定の移動物体 2及び静止物体 3の数を高速に数える装置として請求項 5記載の視覚装置を利用することができる。

さて、請求項 1から請求項 5までの視覚装置で用いられている画像記憶手段 1 2、画像振動手段 1 3、エッジ情報生成手段 1 4、エッジ情報形成手段 1 5、物体背景分離手段 1 6、位置/大きさ検出手段 1 7、領域正規化手段 2 7、正規化画像保持手段 2 8及び画像認識手段 2 9は、配列演算ュニット 4 0 (ARRAY OPERATION UNIT) から構成されるデ一夕処理装置 1 1 0を用いることにより実装することができる。そこで以下では、配列演算ュニット 4 0を利用したデータ処理装置 1 1 0の実施形態を挙げ、請求項 6から請求項 1 2までに記載された視覚装置を図面を参照して説明する。

まず配列演算ュニット 4 0は、入力画像の 1つの画素とその近傍画素を用いることにより、出力画像の 1つの画素を生成する。そこで第 1 3図に示したように、配列演算ュニット 4 0を入力画像のサイズに合わせて格子状に配列したデータ処理装置 1 1 0を用いることにより、データ処理装置 1 1 0は入力画像から出力画像を生成することができる。なお第 1 3図において、配列演算ユニット 4 0を A〇Uと略記する。次に配列演算ユニット 4 0は専用ハードウェアによって実装されても良いし、汎用コンピュータ上でソフトゥェァによって実装することもできる。つまり入力画像から出力画像を生成することができれば、実装手段は制限されない。したがって配列演算ュニット 4 0のァルゴリズムを示すことにより、データ処理装置 1 1 0の画像処理を示すことができる。そこで配列演算ュニット 4 0のアルゴリズムを示すために、画像記憶手段 1 2 (第 1図及び第 6図参照）、画像振動手段 1 3 (第 3図、第 4図及び第 5図参照）、エッジ情報生成手段 1 4 (第 1図及び第 6図参照）、エッジ情報形成手段 1 5 (第 1図ないし第 5図、第 7図ないし第 1 2図参照）、物体 Z背景分離手段 1 6 (第 2、 4、 5、 7図ないし第 1 2図参照）、位置ノ大きさ検出手段 1 7 (第 1図及び第 6図参照）、領域正規化手段 2 7 (第 7図参照）、正規化画像保持手段 2 8 (第 7図参照）及び画像認識手段 2 9 (第 8図参照）で用いる数式について説明する。

幅 w、高さ h、帯域数 bの任意の 2ⁿ階調画像を x、 y、 wとすると、 x、 y、 wは各々位置 P ( i ， j , k) の帯域画素値 χ i _{j k}、 y i _{j k}、 w; _{j k}を用いて数式 1、数式 2及び数式 3のように表される。なお太字はベクトルを示す。また nは非負の整数、 w、 h、 b、 i 、 j 、 kは自然数である。

x =

is value at p(i,j, k),l < i < w,l < j < h,l < k < b} (1) y = {Vijk\yijk is value at p(i,j, k),l < i < w,l < j < h,l < k < b} (2) w =

is value at p(i,j, k),l < i < w,l < j < h,l < k < b} (3) まず前記画像の各帯域画素値に対する点処理に関する関数について以下で説明する。画像 Xを二値画像に変換する場合、数式 4に従って帯域画素値を二値化する。

1 if x_ijk > 0,

Φ fc(x) = (4)

0 otherwise.

画像 xを帯域最大値画像に変換する場合、数式 5に従って i行 j列の画素の各帯域の値のうち最大値を選択する。なお前記帯域最大値画像は単帯域画像となるので、便宜上帯域数 1の前記画像として取り扱うことにする。したがって関数 B i j χ ( χ )の第 3添字は 1 となっている。

Β_ϋ1 χ) = max{rr_iife} (5) 画像 xが二値画像であるとして、画像 Xを反転させる場合、数式 6に従って計算する。

ijk (6) 画像 xの位置 p ( i， j , k) における対数変換は数式 7に従って行われる。ここで _e はオフセットであり、自然対数関数が出力する値が有効範囲に入るようにするために使われるので、一般に e = lで十分である。この対数化により帯域画素値同士の除算を減算にすることができる。また画像 Xが 2ⁿ階調のデジタル画像であるとすると、帯域数に関わらず 2 ⁿ個の要素を含むルックアップテーブルをメモリ上に持つならば、毎回自然対数関数を計算する必要もなく、標準的な対数表を持つ必要もなくなる。

Lijk x = ln(a;_/mfc + e) (7) さて、画像の位置 p ( i , j , k ) における q近傍の位置の集合 P i _{j k}(q )は数式 8 によって表される。ただし Qは 4、 8、 24、 48、 80、 1 20、（2 + 1 )²— 1 と続く数列であり、 rは自然数である。なお画像サイズをはみ出した位置が集合 P i _{j k}(Q )に含まれる場合には、特に指定がない限り位置 P ( i， j , k) を代用するものとする。またこれ以外のときは、指定に従い、画素値が 0に相当し、しかも画像に含まれない架空の位置を代用する。これにより辺縁処理は自動的に行われる。したがって集合 P i j _k(Q

)の要素の数 N i j _kは常に Qとなる。

{p(i + l,j,k), p{i,j + l,k), p(i - k), p(i, j - ] if 9 = 4,

{p(l, m, k) \i— r < I < i + r, j— r < m <j + r, p(l, m, k) p(i, j, k)} ifg = (2r + l)² - l.

(8) そこで次に画像の各帯域画素値に対する最大 8近傍の近傍処理に関する関数及びオペレー夕について以下で説明する。

画像 Xの位置 p ( i , j , k ) における振動は数式 9に従って行われる。ここで位置 p ( i , j , k) の Q近傍の中から 1つの位置だけを選択する方法によって画像単位で振動させるか画素単位で振動させるかを決定することができる。もし画像 Xの全ての位置において、全く同じ方法により Q近傍の中から 1つを選択すれば、画像 Xは画像単位で振動する。一方で画像 Xの各々の位置において、疑似乱数などを用いてランダムに Q近傍の中から 1つを選択すれば、画像 Xは画素単位で振動する。三 'fc(x) = ximk for only one of p(l, m, k) G ( ) (9) 画像 xの位置 P ( i， j , k) における平滑化は数式 1 0に従って行われる。ただし i n t ( v) は実数 vの小数点以下切り捨てを意味するものとする。もし画像 Xの帯域画素値が整数値であるならば、ハードウェアの実装時に N i _{j k} = 4のとき X _lmkの総和に対して右シフト命令を 2回、 N i _{j k}= 8のとき X _lmkの総和に対して右シフト命令を 3回実行するような回路に変更することにより、除算を実行する回路を省くことができる。

Sijk x = int(-r^— ^ximk) (10)

k p(l,m,k)eP_ijk(q)

ラプラシアンの計算であるが、これは数式 1 1に示すように単なる 2階差分オペレー夕である。 8近傍の方がノィズの微妙な変化を捉えてゼロ点およびゼロ交差が多くなり、本発明には向いている。ただし N i _{j k}が 4か 8であるので、もしハードウェアの実装時に N i j _k = 4のとき X _{u k}に対して左シフト命令を 2回、 N i _{j k}= 8のとき X i _{j k}に対して左シフト命令を 3回実行するような回路に変更することにより、実数の乗算を実行する回路を省くことができる。

V¾_fcx = L ^ximk - N_ijkx_ijk (11)

p(l,m,k)€Pijk(g)

ラプラシアンによつて求められた値からゼロ点を見付ける方法として、従来は正から負に変化する画素を見付けていたが、本発明では数式 1 2に従い、負から正にゼロ交差する画素の他に、負からゼロやゼロから正などゼロ点が経由したり、ゼロが継続する画素を見付けるようにする。本発明では、数式 1 2が見付けたゼロ点はエッジのある場所ではなく、ノイズのある場所、つまりエッジのない場所になる。また数式 1 2により実数値の二値化も同時に行っている <

1 if x_ijk < 0 and x_imk > 0 forョ ρ(ί, m, k) e Pijk{q),

Z"k、 ) (12)

0 otherwise.

画像 xが任意の二値画像であるとして、画像 Xのうち孔が空いている画素を埋める場合には、数式 1 3に従い計算する。ここで f は埋めるべき孔の大きさを表すパラメ一夕であり、一般には f = lで十分である。なお 4近傍の場合にはその性質上対角線を検知することができないので、極力 8近傍にした方がよい。

1

Xijk otherwise.

画像 xが任意の二値画像であるとして、画像 Xのうち孤立点なレゝし孤立孔を削除する場合には、数式 1 4に従い計算する。なお 4近傍の場合にはその性質上対角線を検知することができないので、極力 8近傍にした方がよい。

0 ii Xijk = 1 and ∑_P(i,_m,k)eP_{ij k}{_q) ^ximk = 0,

Aijk (^x) = { I if Xijk = 0 and ∑_p， _m,_fc)ePijfc(9) xi_mk = N_ijk, (14)

Xij_k otherwise.

画像 xが任意の二値画像であるとして、画像 Xのうち線幅が 1である画素を検知するために、 4近傍画素を用いて数式 1 5に従い計算する。

^ijk if ^i-ljk + ^i+ljk = 0 ΟΓ X{j-ik + Xij+lk = 0,

(15)

0 otherwise.

2つの画像 x、 yが任意の二値画像であり、画像 yが画像 Xのうち線幅が 1である画素を検知した画像であるとすると、画像 Xのうち線幅が 1である画素の線幅を拡張するために、 4近傍画素を用いて数式 1 6に従い計算する。 1 if Vi-ijk + yi+ijk + Vij-ik + Vij+ik > 0,

K_ijk x, y) (16)

Xij_k otherwise.

そこで数式 1 5の線幅検知と数式 1 6の線幅拡張を用いると、数式 1 7に従い二値画像の線幅補完を簡単に記述することができる。

次に画像の各帯域画素値に対する近傍処理に関する関数及びオペレータについて以下で説明する。

2つの画像 x、 yがある場合、これらの画像の最大値画像は数式 1 8に従って計算される。 i_fc (x, y) = < (18)

Uijk otherwise.

2つの画像 x、 yがある場合、これらの画像の差分は数式 1 9に従って計算される。 fe(x, y) = Xijk - yak (19) ここで数式 1 1のラプラシアンと数式 1 9の差分を用いると、数式 2 0に従い画像の鮮鋭化を簡単に記述することができる。 "_Χ) = (χ, χ) (20)

2つの画像 x、 yがあり、画像 yが単帯域二値画像である場合、数式 2 1に従い、画像 yの帯域画素値を用いて画像 Xの各帯域画素値をマスクすることができる。

O_ijk(x, y) = XijkViji (21) 2つの画像 x 、 yがあり、画像 Xと yが二値画像である場合、数式 2 2に従い、画像— x を基に画像 yを整形することができる。

otherwise.

2つの画像 x、 yがあり、画像 yが二値画像である場合、数式 2 3に従い、画像 yで指定されなかつた画像 Xの帯域画素値を、画像 Xの帯域画素値の近傍のうち画像 yで指定された画像 Xの帯域画素値の平均値で補間する。ただし i n t ( v ) は実数 _vの小数点以下切り捨てを意味するものとする。

m^t(~V ~ ) ^lf Viji = 0 and ∑_p , _mJ) ( yimi > 0,

：

Xijk otherwise.

(23) さて本発明では、画素の位置や移動量なども画像データのように扱うことで処理を単純にしている。これを位置の画像化と呼ぶ。以下では画像化に関する幾つかの関数及びオペレー夕について説明する。

まず位置 p ( 1 ， m， o ) のし m、 o各々の値を画像データとして帯域画素値に変換するオペレータを #とし、変換された帯域画素値を # p ( 1 , m, o ) とする。次に帯域画素値が位置 p ( i , j ， k )から位置 p ( i + 1 , j +m, k + o ) へ移動する場合を考える。このとき帯域画素値の移動量は位置 p ( 1 , m, o ) として表されるものとする。つまり移動量はある位置からのベクトルと見なすことができる。最後に帯域画素値から位置を取り出すオペレータをとする。したがって # ^{- 1} # p ( 1 , m, o ) = p ( 1 , m, o )となる。

そこで数式 2 4に従い、移動量 p ( i ， j , k ) を幅方向と高さ方向で表される平面内で 1 8 0度反対方向に向けることができる。 T(p(i， j, )） = p(-i, -j, k) (24) 画像 xがあり、画像 xが単帯域二値画像である場合、画像 Xの位置 p ( i , j , 1 ) における重心位置への移動量は数式 25に従い計算される。なお、本来重心を計算する際には除算を行う必要があるが、 8近傍内への移動量を計算する際に除算は相殺されてしまうので、数式 25では除算が省かれている。

Giji x) =p{ (I - i)ximi, L (m - j _iml,0) (25) ρ(ί,τη,1)εΡ_ϋι(9) p(l,m,l)ePiji(q)

移動量 P ( i , j， k)から、数式 26及び 27に従い 8近傍内への移動量を計算し、移動量画像に画像化することができる。なお数式 27は、画像の離散化により数式 26では対応しきれない場合にのみ利用する。 fc(l，0,fc) ifi > 0, |i| < |i|/2,

i (l， - 1, ) ifi > 0,j <0, |i|/2 < |i| < 2|i|

， - 1, ) ifj < 0, 2|i| < |i|,

-l, -1， k) ifz < 0， j < 0， \i\/2 < \j\ < 2\i\

e(p(i ,k)) = fc(_l，0, ) ifi < 0,レ ·| < I/2, (26) ϋ_Ρ (— 1,1，） ifi < 0, > 0, |i|/2 < | | < 2|i|

1， ) ifj > 0, 2|i| < | |,

t (l，l， ) ifi > 0,j > 0， \i\/2 < \j\ < 2\i\

¾p(0, 0, k) otherwise. tip(l，0，） ifz> 0, |i| < |z|/2,

tJp(l,0,¾) ifi> 0,j< 0, |/2<|i| < 2|i|,

fc(0，l, ) ifi<0,j> 0, I/2 < | | < 2|z|,

&(p(i,j,k)) = (27) 。，l, ) ifi> 0, 2\i\ < \j\,

| 1，1， ) ifi>0,i>0, \i\/2 < \j\ < 2\i\,

t)p(0, 0, k) otherwise .

したがって数式 25、 26及び 27を用いると、数式 28及び 29に従い、単帯域二値画像 Xの重心方向への移動量画像の帯域画素値を簡単に記述することができる。なお移動量画像の帯域数は 1となる。

Δ„ι(χ) = 0(G_i:)i(x)) (28)

A^.₁(x)=e'(G_{i l}(x)) (29) 一方で数式 24を用いると重心位置の反対位置を求めることができるので、数式 30に従い、単帯域二値画像 Xの重心と反対方向への移動量画像の帯域画素値を簡単に記述することができる。なお移動量画像の帯域数は 1となる。

¾ii(x) = e(T(G_ijl(x))) (30)

2つの画像 x、 yがあり、画像 yが移動量画像である場合、数式 31に従い、画像 yで指し示された移動位置に画像 Xの帯域画素値を移動した後、同じ帯域画素に移動した帯域画素値の合計を濃淡画像にすることができる。

rifc( , ) = ∑x_imfc for p(l,m,l) G Piji(q) and tt^_1y_imi = p(i - m,0). (31) そこで数式 4、 28、 29及び 31を用いることにより、数式 32又は 33に従い、単帯域濃淡画像 Xを近傍の重心方向に移動した後、同じ帯域画素に移動した帯域画素値の合計を簡単に記述することができる。

Λ_ϋι(χ) = Γ_ί (χ,Α(Φ(χ))) (32)

2つの画像 x、 yがあり、画像 Xが二値画像で、画像 yが移動量画像である場合、画像 Xの各帯域画素値の移動先の位置を求めることができるので、移動先が重複する帯域画素値を見つけることができる。そこで画像 Xの各帯域画素値の移動先が重複することなく、しかも移動する各帯域画素値が存在することを表す移動可能画像の帯域画素値は、数式 3 4に従い生成される。なお移動可能画像の帯域数は 1となる。

1 if Xiji = 0 and {|一 i _ml = p(i— l,j— m, 0)

Hiji(x, y) = { for only one οϊ p(l, m, 1) G ¾i( ， (34)

0 otherwise.

3つの画像 x、 y、 wがあり、画像 yが移動可能画像であり、画像 wが移動量画像である場合、数式 3 5に従い画像 Xの帯域画素値を移動することができる。 ximk if Viji = 1 and ¹ mi = P{i一 j— m, 0)

forョ p ， m, 1) e Piji(g),

？ i,-fc(x,y, ) = 0 if yimi = 1 and ¾^_1^ι = p(l - i,m- j, 0) (35) forョ; )(Z，m，l) G Piji(q),

Xij_k otherwise.

そこで数式 30、 34及び 35を用いると、数式 36に従い、二値画像 yから計算される重心位置と反対方向に画像 Xの帯域画素を移動することで得られる画像の帯域画素値を簡単に記述することができる。

¾fc(x,y) = T_ijfc(x,H(y,R(y)),R(y)) (36) 数式 1から数式 3 6までを用いることにより、画像記憶手段 1 2 (図 1及び図 6参照）、画像振動手段 1 3 (第 3図、第 4図及び第 5図参照）、エッジ情報生成手段 1 4 (第 1図及び第 6図参照）、エッジ情報形成手段 1 5 (第 1図ないし第 5図、第 7図ないし第 1 2 図参照）、物体 Z背景分離手段 1 6 (第 2、 4、 5、 7図ないし第 1 2図参照）、位置 Z大きさ検出手段 1 7 (第 1図及び第 6図参照）、領域正規化手段 2 7 (第 7図参照）、及び正規化画像保持手段 2 8 (第 7図参照）を実装することができるデータ処理装置 1 1 0の全ての配列演算ュニット 4 0のァルゴリズムを記述することができる。以下では、データ処理装置 1 1 0中の任意の配列演算ュニット 4 0のァルゴリズムを用いて、画像振動手段 1 3、エッジ情報生成手段 1 4、エッジ情報形成手段 1 5、位置大きさ検出手段 1 7及び領域正規化手段 2 7に対応する請求項 6から請求項 1 0までに記載されている視覚装置について説明する。

データ処理装置 1 1 0によって実現される画像記憶手段 1 2 (第 1図及び第 6図参照）がデジタル画像 1 1 1を記憶するために、格子状に配列された配列演算ユニット 4 0は同期して並列に動作する。格子上 i行 j列に配置された配列演算ュニット 4 0を AOU s j とすると、 AOU i j のアルゴリズムは第 1 4図のようになる。

ステップ 1 2 0 1で、 AO U i j を格子上の i行：)'列に配置する。これは論理的であれ物理的であれ、 AO U i jの近傍を決定するために必要である。

ステップ 1 2 0 2で、 AOU ! j の近傍や変数の初期値を設定する。

ステップ 1 2 0 3で、順次入力されるデジタル画像 1 1 1が無くなつたかどうか判断する。もしデジタル画像 1 1 1が無ければ（ステップ 1 2 0 3 ： Y E S ) , アルゴリズムを終了する。もしデジタル画像 1 1 1があれば（ステップ 1 2 0 3 : N〇）、ステップ 1 2 0 4に移行する。ただし特定の画像サイズのみに対して配列演算ュニット 4 0を実装する場合には、無限ループにしても良い。

ステップ 1 2 0 4で、デジタル画像 1 1 1が準備されるまで入力待ちをする。

ステップ 1 2 0 5で、デジタル画像 1 1 1の i行 j列の画素を帯域数分入力する。このため AOU ; jは少なくとも帯域数分の画像データを記憶するメモリ 4 2を必要とする。ステップ 1 2 0 6で、入力待ちの間出力できるように、デジタル画像 1 1 1の i行 j列の画素を記憶する。

ステップ 1 2 0 7で、デジタル画像 1 1 1の帯域画素値を出力する。その後ステップ 1 2 0 3に戻る。

これにより、配列演算ユニット 4 0から構成されるデータ処理装置 1 1 0を用いて、画像記憶手段 1 2に対応する視覚装置はデジタル画像 1 1 1を記憶することができる。データ処理装置 1 1 0によって実現される請求項 6記載の画像振動手段 1 3 (第 3図、第 4図及び第 5図）がデジタル画像 1 1 1を振動させるために、格子状に配列された配列演算ュニッ卜 4 0は同期して並列に動作する。格子上 i行 j列に配置された配列演算ュニット 4 0を A〇U i j とすると、 AO U i jのアルゴリズムは第 1 5図のようになる。ステップ 1 3 0 1で、 AOU j j を格子上の i行 j列に配置する。これは論理的であれ物理的であれ、 AO U i j の近傍を決定するために必要である。

ステップ 1 3 0 2で、 AOU i』の近傍や変数の初期値を設定する。

ステップ 1 3 0 3で、順次入力されるデジタル画像 1 1 1が無くなつたかどうか判断する。もしデジタル画像 1 1 1が無ければ（ステップ 1 3 0 3 ： Y E S ) , アルゴリズムを終了する。もしデジタル画像 1 1 1があれば（ステップ 1 3 0 3 : N〇）、ステップ 1 3 0 4に移行する。ただし特定の画像サイズのみに対して配列演算ュニット 4 0を実装する場合には、無限ループにしても良い。

ステップ 1 3 0 4で、デジタル画像 1 1 1の i行 j列の画素を帯域数分入力する。このため AOU _uは少なくとも帯域数分の画像データを記憶するメモリ 4 2を必要とする。ステップ 1 3 0 5で、関数 S _{u k} ( X )に従いデジタル画像 1 1 1の i行 j列の画素を近傍画素の 1つに移動させる。

ステップ 1 3 0 6で、デジタル画像 1 1 1の帯域画素値を出力する。その後ステップ 1 3 0 3に戻る。

これにより、配列演算ユニット 4 0から構成されるデータ処理装置 1 1 0を用いて、画像振動手段 1 3に対応する請求項 6記載の視覚装置はデジタル画像 1 1 1を振動させることができる。

データ処理装置 1 1 0によって実現される請求項 7記載のエッジ情報生成手段 1 4 (第 1図及び第 6図参照）がデジタル画像 1 1 1から粗エッジ情報画像 1 1 3を生成するために、格子状に配列された配列演算ュニット 4 0は同期して並列に動作する。格子上 i行 j 列に配置された配列演算ユニット 4 0を AOU i j とすると、エッジ情報生成手段 1 4に対する AOU i j のアルゴリズムは第 1 6図のようになる。

ステップ 1 4 0 1で、 A〇U； j を格子上の i行 j列に配置する。これは論理的であれ物理的であれ、 AOU i jの近傍を決定するために必要である。

ステップ 1 4 0 2で、 AOU i』の近傍や変数の初期値を設定する。近傍の設定においては、前記各関数で使う近傍サイズ Qを個別に 4か 8に決めても良いし、全部を 4か 8に統一しても良い。本発明のエッジ情報生成手段 1 4が生成する粗エッジ情報 1 1 2の正確さを上げるためには近傍サイズ Qを全て 8に設定することが望ましい。しかしながら粗エッジ情報 1 1 2を生成するための計算時間の制約や、デジタル画像 1 1 1の帯域数などにより、エッジ情報生成手段 1 4は必要に応じて適宜近傍サイズを変えることで対処することができる。

ステップ 1 4 0 3で、デジタル画像 1 1 1が終了したかどうか判断する。もしデジタル画像 1 1 1が無ければ（ステップ 1 4 0 3 ： Y E S ) , アルゴリズムを終了する。もしデジタル画像 1 1 1があれば（ステップ 1 4 0 3 : NO )、アルゴリズムを終了する。ただし特定の帯域数と画像サイズに対して配列演算ュニット 4 0を実装する場合には、無限ループにしても良い。

ステップ 1 4 0 4で、デジタル画像 1 1 1の i行 j列の画素を帯域数分入力する。これは、 AOU _uがデジタル画像 1 1 1の i行 j列の画素を一括して処理するためである。このため AOU i jは少なくとも帯域数分の画像データを記憶するメモリ 4 2を必要とする。

ステップ 1 4 0 5で、 AOU i jが近傍の配列演算ユニット 4 0と通信することにより、入力したデジタル画像 1 1 1の各帯域画素値に対して関数 S；』 _k ( X )に従い平滑化を行う。平滑化された帯域画素値は平滑化画像の帯域画素値として扱われる。ここで関数 i _{j k} ( X )は必要に応じて数回繰り返しても良い。一般的なカラ一画像の場合、 2回で十分である。

ステップ 1 4 0 6で、平滑化画像の各帯域画素値に対して関数 L i _{j k} ( x )に従い対数変換を行う。対数変換された帯域画素値は対数変換画像の帯域画素値として扱われる。ステップ 1 4 0 7で、 A〇U _Uが近傍の配列演算ユニット 4 0と通信することにより、対数変換画像の各帯域画素値に対して関数 E i』 _k ( X )に従い鮮鋭ィ匕を行う。鮮鋭化された帯域画素値は鮮鋭化画像の帯域画素値として扱われる。

ステップ 1 4 0 8で、鮮鋭化画像の各帯域画素値に対して関数 D i _{j k} ( X , y )に従い 1入力前鮮鋭化画像の各帯域画素値を引く。差分を計算された帯域画素値は時間差分画像の帯域画素値として扱われる。

ステップ 1 4 0 9で、 1入力前鮮鋭化画像の各帯域画素値を鮮鋭化画像の対応する各帯域画素値で置き換える。

ステップ 1 4 1 0で、 AOU i jが近傍の配列演算ユニット 4 0と通信することにより、時間差分画像の各帯域画素値に対してオペレータ V _{j k} Xに従いラプラシアンの計算を行う。ラプラシアンを計算された帯域画素値は時間差分ラプラシアン画像の帯域画素値として扱われる。

ステップ 1 4 1 1で、 AOU i jが近傍の配列演算ユニット 4 0と通信することにより、時間差分ラプラシアン画像の各帯域画素値に対して関数 Z i』 _k ( X )に従いゼロ点を抽出する。ゼロ点を抽出された帯域画素値は時間差分ゼロ点画像の帯域画素値として扱われる。

ステップ 1 4 1 2で、時間差分ラプラシアン画像の各帯域画素値に対して関数 B i』 X )に従い各帯域画素値のうち最大値を検出する。検出された最大値帯域画素値は最大値時間差分ゼロ点画像の帯域画素値として扱われる。なお便宜上帯域数は 1である。ステップ 1 4 1 3で、 AOU i jが近傍の配列演算ユニット 4 0と通信することにより、鮮鋭化画像の各帯域画素値に対してオペレータ V f _{j k} Xに従いラプラシアンの計算を行う。ラプラシアンを計算された帯域画素値はラプラシアン画像の帯域画素値として扱われる。

ステップ 1 4 1 4で、 AOU i】が近傍の配列演算ユニット 4 0と通信することにより、ラプラシアン画像の各帯域画素値に対して関数 Z i』 _k ( X )に従いゼロ点を抽出する。ゼ口点を抽出された帯域画素値はゼロ点画像の帯域画素値として扱われる。

ステップ 1 4 1 5で、ラプラシアン画像の各帯域画素値に対して関数 B i j _x ( x )に従い各帯域画素値のうち最大値を検出する。検出された最大帯域画素値は最大値ゼロ点画像の帯域画素値として扱われる。なお便宜上帯域数は 1である。

ステップ 1 4 1 6で、ラプラシアン画像の各帯域画素値と時間差分ラプラシアン画像の各帯域画素値に対して関数 M i j _k ( x， y )に従い各々の画像の同じ位置にある帯域画素値のうち最大値を検出する。検出された最大帯域画素値は混成ゼロ点画像の帯域画素値として扱われる。なお便宜上帯域数は 1である。

ステップ 1 4 1 7で、 AOU i jが近傍の配列演算ユニット 4 0と通信することにより、混成ゼロ点画像の帯域画素値に対して関数 F i j _k ( X )に従い孔を除去する。孔を除去された帯域画素値は孔除去混成ゼ口点画像の帯域画素値として扱われる。なお便宜上帯域数は 1である。ここで関数 F i _{j k} ( X )は必要に応じて数回繰り返しても良い。一般的な力ラ一画像の場合、 1回で十分である。

ステップ 1 4 1 8で、 AOU i〗が近傍の配列演算ユニット 4 0と通信することにより、孔除去混成ゼロ点画像の帯域画素値に対して関数 A ; _{j k} ( x )に従い孤立点および孤立孔を除去する。孤立点および孤立孔を除去された帯域画素値はノイズ除去混成ゼロ点画像の帯域画素値として扱われる。なお便宜上帯域数は 1である。

ステップ 1 4 1 9で、ノイズ除去混成ゼロ点画像の帯域画素値に対して関数 I i _{j k} ( X )に従い 0と 1を反転させる。反転された帯域画素値は粗エッジ情報画像 1 1 3の帯域画素値として扱われる。

ステップ 1 4 2 0で、粗エッジ情報画像 1 1 3の帯域画素値を出力する。その後ステツプ 1 4 0 3に戻る。これにより、配列演算ユニット 4 0から構成されるデータ処理装置 1 1 0を用いて、エツジ情報生成手段 1 4に対応する請求項 7記載の視覚装置はデジタル画像 1 1 1から粗エツジ情報画像 1 1 3を生成することができる。

第 1 7図に示すように、データ処理装置 1 1 0によって実現されるエッジ情報形成手段— 1 5 (第 1図ないし第 5図、図、第 7図ないし第 1 2図参照）が、粗エッジ情報 1 1 2から構成される請求項 8記載の粗エッジ情報画像 1 1 3及びデジタル画像 1 1 1から、形成エッジ情報 1 1 4から構成される形成エッジ情報画像 1 1 5を生成するために、格子状に配列された配列演算ュニッ卜 4 0は同期して並列に動作する。格子上 i行 j列に配置された配列演算ュニット 4 0を AOU i j とすると、 A〇U i j のァルゴリズムは第 1 8図のようになる。

ステップ 1 5 0 1で、 A〇U i』を格子上の i行 j列に配置する。これは論理的であれ物理的であれ、 AO U i jの近傍を決定するために必要である。

ステップ 1 5 0 2で、 AO U i】の近傍や変数の初期値を設定する。近傍の設定においては、前記各関数で使う近傍サイズ qを個別に 4か 8に決めても良いし、全部を 4か 8に統一しても良い。本発明のエッジ情報形成手段 1 5が形成した形成エッジ情報 1 1 4の正確さを上げるためには近傍サイズ Qを全て 8に設定することが望ましい。しかしながら粗エッジ情報 1 1 2を形成するための計算時間の制約や、入力されるデジタル画像 1 1 1の帯域数などにより、エッジ情報形成手段 1 5は必要に応じて適宜近傍サイズを変えることで対処することができる。

ステップ 1 5 0 3で、順次入力されるデジタル画像 1 1 1又は粗エッジ情報画像 1 1 3 が無くなつたかどうか判断する。もしデジタル画像 1 1 1若しくは粗エッジ情報画像 1 1 3のいずれかが無ければ（ステップ 1 5 0 3 ： Y E S ) , アルゴリズムを終了する。もしデジタル画像 1 1 1若しくは粗エッジ情報画像 1 1 3のいずれかがあれば（ステップ 1 5 0 3 ： NO )、ステップ 1 5 0 4に移行する。ただし特定の帯域数と画像サイズに対して配列演算ュニット 4 0を実装する場合には、無限ループにしても良い。

ステップ 1 5 0 4で、デジタル画像 1 1 1及び粗エッジ情報画像 1 1 3の i行 j列の画素を帯域数分入力する。これは、 AOU i】がデジタル画像 1 1 1及び粗エッジ情報画像 1 1 3の i行 j列の画素を一括して処理するためである。このため AOU i jは少なくとも帯域数分の画像データを記憶するメモリ 4 2を必要とする。

ステップ 1 5 0 5で、デジタル画像 1 1 1の i行 j列の画素と粗エッジ情報画像 1 1 3一の i行 j列の画素を分離する。これは、 AO U i】がデジタル画像 1 1 1の i行 j列の画素と粗エッジ情報画像 1 1 3の i行 j列の画素を各々独立した画像の画素として処理するためである。もしデジタル画像 1 1 1の i行 j列の画素と粗エッジ情報画像 1 1 3の i行 j列の画素が初めから分離されて入力されていれば、特に何もしない。

ステップ 1 5 0 6で、 AOU i jが近傍の配列演算ユニット 4 0と通信することにより、入力したデジタル画像 1 1 1の各帯域画素値に対して関数 S i j _k ( X )に従い平滑化を行う。平滑化された帯域画素値は平滑化画像の帯域画素値として扱われる。ここで関数 S i_{j k} ( X )は必要に応じて数回繰り返しても良い。一般的なカラ一画像の場合、 2回で十分である。

ステップ 1 5 0 7で、平滑化画像の各帯域画素に対して関数 L _{U k} ( X )に従い対数変換を行う。対数変換された帯域画素値は対数変換画像の帯域画素値として扱われる。ステップ 1 5 0 8で、 AOU i jが近傍の配列演算ュニット 4 0と通信することにより、対数変換画像の各帯域画素値に対して関数 E i j _k ( X )に従い鮮鋭化を行う。鮮鋭化された帯域画素値は鮮鋭化画像の帯域画素値として扱われる。

ステップ 1 5 0 9で、 AOU i jが近傍の配列演算ユニット 4 0と通信することにより、鮮鋭化画像の各帯域画素値に対してオペレータ V ^ _{j k} Xに従いラプラシアンの計算を行う。ラプラシアンを計算された帯域画素値はラプラシァン画像の帯域画素値として扱われる。

ステップ 1 5 1 0で、 AO U i jが近傍の配列演算ユニット 4 0と通信することにより、ラプラシアン画像の各帯域画素値に対して関数 Z！』 _k ( X )に従いゼロ点を抽出する。ゼ口点を抽出された帯域画素値はゼロ点画像の帯域画素値として扱われる。

ステップ 1 5 1 1で、ゼロ点画像の各帯域画素値に対して関数 B i』 X )に従い各帯域画素値のうち最大値を検出する。検出された最大帯域画素値は最大値ゼロ点画像の帯域画素値として扱われる。なお便宜上帯域数は 1である。

ステップ 1 5 1 2で、最大値ゼロ点画像の帯域画素値に対して関数 I _{U k} ( X )に従い 0と 1を反転させる。反転された帯域画素値は基礎エッジ情報画像の帯域画素値として扱われる。

ステップ 1 5 1 3で、入力した粗エッジ情報画像 1 1 3の帯域画素値は初め整形粗エツジ情報画像の帯域画素値として扱われ、 AO U i jが近傍の配列演算ュニット 4 0と通信することにより、基礎エッジ情報画像の帯域画素値を用いて、整形粗エッジ情報画像の帯域画素値に対して関数 Q i _{j k} ( X , y )に従い整形を行う。整形された帯域画素値は再び整形粗エッジ情報画像の帯域画素値として扱われる。ここで関数 Q i _{j k} ( X , y )は本来整形粗ェッジ情報画像の帯域画素値が変化しなくなるまで繰り返される。ただし計算時間の制約、入力される粗エッジ情報画像 1 1 3の品質、形成される形成エッジ情報画像 1 1 5に求められる品質などにより、整形処理は適当な繰り返し回数で計算を打ち切った方が良い。

ステップ 1 5 1 4で、 AOU i ₃が近傍の配列演算ユニット 4 0と通信することにより、整形粗エッジ情報画像の帯域画素値に対して関数 C i _{j k} ( x こ従い線幅補完を行う。補完された帯域画素値は形成エッジ情報画像 1 1 5の帯域画素値として扱われる。

ステップ 1 5 1 5で、形成エッジ情報画像 1 1 5の帯域画素値を出力する。その後ステツプ 1 5 0 3に戻る。

これにより、配列演算ユニット 4 0から構成されるデータ処理装置 1 1 0を用いて、エツジ情報形成手段 1 5に対応する請求項 8記載の視覚装置は粗エッジ情報画像 1 1 3から形成エッジ情報画像 1 1 5を生成することができる。

ここで粗エッジ情報画像 1 1 3から形成エッジ情報画像 1 1 5への形成とは、ある場面を撮影した低解像度のデジタル画像 1 1 1から生成されたエッジ情報から、同じ場面を撮影した高解像度のデジタル画像 1 1 1から生成されるべきエッジ情報を推定することであると見なすことができる。そこで自然数 ηに対して、第 1 9図に示すように、デジタル画像 1 1 1の解像度を 1 /nに低くした低解像度デジタル画像 1 1 6から、エッジ情報生成手段 i 4を用いて低解像度粗エッジ情報画像 1 1 7を生成した場合、低解像度粗エツジ情報画像 1 1 7を n倍拡大することにより粗エッジ情報画像 1 1 3を生成することができる。ただしデジタル画像 1 1 1の解像度を l Znにするためには、水平及び垂直方向に対して単純にデジタル画像 1 1 1の連続する n個のうち 1個を抽出すれば良い。また低解像度粗エッジ情報画像 1 1 7を n倍拡大するためには、水平及び垂直方向に対して単純に低解像度粗エッジ情報画像 1 1 7の連続する画素の間に帯域画素値が 0である画素を n— 1個埋めれば良い。このとき nがあまり大きくなければ、エッジ情報形成手段 1 5を実現するデータ処理装置 1 1 0が、低解像度粗エッジ情報画像 1 1 7を拡大した粗エッジ情報画像 1 1 3を形成した形成エッジ情報画像 1 1 5と、エッジ情報形成手段 1 5を実現するデータ処理装置 1 1 0が、デジタル画像 1 1 1から生成した粗エッジ情報画像 1 1 3を形成した形成エッジ情報画像 1 1 5とは、ほとんど同じものになる。この理由は、エッジ情報形成手段 1 5がデジタル画像 1 1 1を用いて内部で生成したエッジ情報のうちどのエッジ情報を利用するのか参考にするために、エッジ情報形成手段 1 5が粗エツジ情報画像 1 1 3を用いているだけだからである。したがって低解像度粗エッジ情報画像 1 1 7を拡大した粗エッジ情報画像 1 1 3をエッジ情報形成手段 1 5に入力した場合、低解像度デジタル画像 1 1 6から低解像度粗エッジ情報画像 1 1 7を生成するエッジ情報生成手段 1 3を実現するデータ処理装置 1 1 0はハードウェア量を低減することができる。さらにこの方法を発展させると、第 2 0図に示すように、デジタル画像 1 1 1の解像度を低くした低解像度デジタル画像 1 1 6から生成した低解像度粗エッジ情報画像 1 1 7のうち、粗エッジ情報 1 1 2の周辺を切り出した低解像度切出粗エッジ情報画像 1 1 8を生成することができる。この低解像度切出粗エッジ情報画像 1 1 8を拡大した切出粗エッジ情報画像 1 1 9と、デジタル画像 1 1 1のうち同じ領域を切り出した切出デジタル画像 1 2 0をエッジ情報形成手段 1 4を実現するデータ処理装置 1 1 0に入力すると、切出形成エッジ情報画像 1 2 1を生成することができる。この場合、エッジ情報形成手段 1 4を実現するデータ処理装置 1 1 0はハードウェア量を低減することができる。第 2 1図に示すように、データ処理装置 1 1 0によって実現される請求項 9記載の位置/大きさ検出手段 1 7 (第 1図及び第 6図参照）が粗エッジ情報 1 1 2を画素とする粗エッジ情報画像 1 1 3から重複情報 1 3 1を画素とする重複情報画像 1 3 2を生成するために、格子状に配列された配列演算ユニット 4 0は同期して並列に動作する。格子上 i行 j列に配置された配列演算ユニット 4 0を AO U i〕とすると、 AOU _uのァルゴリズムは第 2 2図のようになる。

ステップ 1 7 0 1で、 AO U i j を格子上の i行 j列に配置する。これは論理的であれ物理的であれ、 AO U i』の近傍を決定するために必要である。

ステップ 1 7 0 2で、 AOU i j の近傍や変数の初期値を設定する。近傍の設定においては、前記各関数で使う近傍サイズ Qを個別に決めても良いし、全部を統一しても良い。本発明のデータ処理装置 1 1 0が生成した重複情報画像 1 3 2の正確さを上げるためには近傍サイズ Qを全て大きな値に設定することが望ましい。しかしながら物体の粗ェッジ情報 1 1 2の重心を計算するための計算時間の制約や、入力される粗エッジ情報画像 1 1 3のサイズなどにより、位置/大きさ検出手段 1 7は必要に応じて適宜近傍サイズを変えることで対処することができる。

ステップ 1 7 0 3で、順次入力される粗エッジ情報画像 1 1 3が無くなつたかどうか判断する。もし粗エッジ情報画像 1 1 3が無ければ（ステップ 1 7 0 3 : Y E S ) , ァルゴリズムを終了する。もし粗エッジ情報画像 1 1 3があれば（ステップ 1 7 0 3 : N O ) , ステップ 1 7 0 4に移行する。ただし特定の画像サイズのみに対して配列演算ュニット 4 0を実装する場合には、無限ループにしても良い。

ステップ 1 7 0 4で、粗エッジ情報画像 1 1 3の i行 j列の画素を 1帯域分入力する。このため AOU； jは少なくとも 1帯域分の画像データを記憶するメモリ 4 2を必要とする。

ステップ 1 7 0 5で、粗エッジ情報画像 1 1 3の粗エッジ情報 1 1 2を重複情報画像 1 3 2の重複情報 1 3 1に変換する。重複情報 1 3 1は 1か 0に相当する帯域画素値となる。ステップ 1 7 0 6で、 A〇U i jが近傍の配列演算ユニット 4 0と通信することにより、重複情報画像 1 3 2の各帯域画素値に対して関数 Δ _u i ( X )に従い移動量を計算する。移動量を画像化した帯域画素値は移動量画像の帯域画素値として扱われる。

ステップ 1 7 0 7で、 A〇U i jが近傍の配列演算ユニット 4 0と通信することにより、重複情報画像 1 3 2の各帯域画素値に対して関数 Λ _u i ( X )に従い移動させる。移動した帯域画素値は新たに重複情報画像 1 3 2の帯域画素値として扱われる。

ステップ 1 7 0 8で、ステップ 1 7 0 5からステップ 1 7 0 7までの繰り返し回数を表す移動回数が指定回数に達したかどうか判断する。もし移動回数が指定回数に達していなければ（ステップ 1 7 0 8 : N〇）、ステップ 1 7 0 5に戻る。もし移動回数が指定回数に達していれば（ステップ 1 7 0 8 ： Y E S ) , ステップ 1 7 0 9に移行する。なおこの指定回数は粗エッジ情報画像 1 1 3のサイズや粗エッジ情報 1 1 2が表す物体のサイズ、さらには近傍のサイズ Qにより決定される。利用目的に応じて適切なパラメ一夕を設定すれば、指定回数を大目に決定しても問題はないが、あまり指定回数を多くしすぎると、位置及び大きさの検出に要する時間が長くなる。

ステップ 1 7 0 9で、 AOU i jが近傍の配列演算ユニット 4 0と通信することにより、重複情報画像 1 3 2の各帯域画素値に対して関数 Δ ' _u X )に従い移動量を計算する。移動量を画像化した帯域画素値は移動量画像の帯域画素値として扱われる。

ステップ 1 7 1 0で、 AOU i jが近傍の配列演算ユニット 4 0と通信することにより、重複情報画像 1 3 2の各帯域画素値に対して関数 Λ ' i j i ( X )に従い移動させる。移動した帯域画素値は新たに重複情報画像 1 3 2の帯域画素値として扱われる。

ステップ 1 7 1 1で、重複情報画像 1 3 2の帯域画素値を出力する。その後ステップ 1 7 0 3に戻る。

なお重複情報画像 1 3 2の各重複情報 1 3 1はその位置を中心とした周辺にある粗エツジ情報 1 1 2の総数を表すので、結果的にその位置を中心とした物体の大きさを意味することになる。

これにより、配列演算ユニット 4 0から構成されるデータ処理装置 1 1 0を用いて、位置大きさ検出手段 1 7に対応する請求項 9記載の視覚装置は粗エッジ情報画像 1 1 3_から重複情報画像 1 3 2を生成することができる。当然のことながら請求項 9記載の視覚装置は粗エッジ情報画像 1 1 3の代りに形成エッジ情報画像 1 1 5からも重複情報画像 1 3 2を生成することもできる。したがって配列演算ュニッ卜 4 0から構成されるデータ処理装置 1 1 0を用いて、位置ノ大きさ検出手段 1 7に対応する視覚装置は形成エッジ情報画像 1 1 5から重複情報画像 1 3 2を生成することができる。

ここで第 2 2図のアルゴリズムにおいて粗エッジ情報 1 1 2から構成される粗エッジ情報画像 1 1 3の代りに物体領域 1 4 1を表す物体領域画像 1 4 2を用いると、第 2 3図に示すように、データ処理装置 1 1 0によって実現される位置 Z大きさ検出手段 1 7 (図 2 及び図 4参照）は物体領域 1 4 1を表す物体領域画像 1 4 2からも重複情報 1 3 1を表す重複情報画像 1 3 2を生成することができる。ただし物体領域画像 1 4 2を用いた場合、重複情報画像 1 3 2の各重複情報 1 3 1はその位置を中心とした物体領域 1 4 1の画素の総数を表すので、結果的にその位置を中心とした物体の面積を意味することになる。したがって重複情報画像 1 3 2から物体の大きさを求める場合には重複情報 1 3 1の平方根を取るなど注意を要する。

第 2 4図に示すように、データ処理装置 1 1 0によって実現される請求項 1 0記載の領域正規化手段 2 7 (第 7図参照）が物体領域 1 4 1を含む物体領域画像 1 4 2及びデジ夕ル画像 1 1 1から正規化領域 1 4 4を含む正規化画像 1 4 5を生成するために、格子状に配列された配列演算ュニット 4 0は同期して並列に動作する。格子上 i行 j列に配置された配列演算ユニット 4 0を AO U i 3 とすると、 AOU i j のアルゴリズムは第 2 5図のようになる。

ステップ 2 7 0 1で、 AO U i j を格子上の i行 j列に配置する。これは論理的であれ物理的であれ、 AOU _u の近傍を決定するために必要である。

ステップ 2 7 0 2で、 AO U _uの近傍や変数の初期値を設定する。近傍の設定においては、前記各関数で使う近傍サイズ qを個別に決めても良いし、全部を統一しても良い。本発明の領域正規化手段 2 7が生成した正規化画像 1 4 5の正確さを上げるためには近傍サイズ Qを全て大きな値に設定することが望ましい。しかしながら分離物体領域 1 4 3 を正規化するための計算時間の制約や、入力されるデジタル画像 1 1 1のサイズなどにより、領域正規化手段 2 7は必要に応じて適宜近傍サイズを変えることで対処することがでさる。

ステップ 2 7 0 3で、順次入力される物体領域画像 1 4 2又はデジタル画像 1 1 1が無くなつたかどうか判断する。もし物体領域画像 1 4 2又はデジタル画像 1 1 1が無ければ（ステップ 2 7 0 3 ： Y E S )、アルゴリズムを終了する。もし物体領域画像 1 4 2又はデジタル画像 1 1 1があれば（ステップ 2 7 0 3 ： NO ) , ステップ 2 7 0 4に移行する。ただし特定の帯域数及び画像サイズのみに対して配列演算ュニット 4 0を実装する場合には、無限ループにしても良い。

ステップ 2 7 0 4で、物体領域画像 1 4 2の i行 j列の画素を 1帯域分と、デジタル画像 1 1 1の i行 j列の画素を帯域数分を入力する。これは、 AOU i jが物体領域画像 1 4 2の i行 j列の画素とデジタル画像 1 1 1の i行 j列の画素を一括して処理するためである。このため AO U i jは少なくとも総帯域数分の画像データを記憶するメモリ 4 2 を必要とする。

ステップ 2 7 0 5で、物体領域画像 1 4 2の i行 j列の画素とデジタル画像 1 1 1の i 行 j列の画素を分離する。これは、 AOU _uが物体領域画像 1 4 2の i行:)'列の画素とデジタル画像 1 1 1の i行 j列の画素を各々独立した画像の画素として処理するためである。もし物体領域画像 1 4 2の i行 j列の画素とデジタル画像 1 1 1の i行 j列の画素が初めから分離されて入力されていれば、特に何もしない。

ステップ 2 7 0 6で、 AOU i jが近傍の配列演算ユニット 4 0と通信することにより、物体領域画像 1 4 2の各帯域画素値に対して関数 R i j ( X )に従い移動量を計算する。移動量を画像化した帯域画素値は移動量画像の帯域画素値として扱われる。

ステップ 2 7 0 7で、 AOU； jが近傍の配列演算ュニット 4 0と通信することにより、物体領域画像 1 4 2の各帯域画素値に対して関数 H i j _k ( x , y )に従い移動可能な移動先帯域画素値を見つけることができる。移動可能な移動先であるかどうかを表す値は移動可能画像の帯域画素値として扱われる。

ステップ 2708で、 AOUi jが近傍の配列演算ユニット 40と通信することにより、物体領域画像 142の各帯域画素値に対して関数 Ui j_k( x , y )に従い移動可能先に移動させる。移動した帯域画素値は新たに物体領域画像 142の帯域画素値として扱われる。

ステップ 2709で、 AOUi jが近傍の配列演算ユニット 40と通信することにより、デジタル画像 111の各帯域画素値に対して関数 Ui j_k( x , y )に従い移動可能先に移動させる。移動した帯域画素値は新たにデジタル画像 111の帯域画素値として扱われる。

ステップ 2710で、ステップ 2706からステップ 2709までの繰り返し回数を表す移動回数が指定回数に達したかどうか判断する。もし移動回数が指定回数に達していなければ（ステップ 2710 : NO)、ステップ 2706に戻る。もし移動回数が指定回数に達していれば（ステップ 2710 ： YES), ステップ 2711に移行する。なおこの指定回数はデジタル画像 11 1のサイズやデジタル画像 111の分離物体領域 143のサイズ、さらには近傍のサイズ Qにより決定される。利用目的に応じて適切なパラメ一夕を設定すれば、指定回数を大目に決定しても問題はないが、あまり指定回数を多くしすぎると、正規化に要する時間が長くなる。

ステップ 2711で、 AOUi jが近傍の配列演算ユニット 40と通信することにより、移動を完了した物体領域画像 142の各帯域画素値に対して関数 V i _{j k}( x , y )に従い近傍の平均値で補間する。なお Xと yは共に物体領域画像 142となる。平均値で埋められた帯域画素値は正規化物体領域画像の帯域画素値として扱われる。

ステップ 2712で、 AOUi jが近傍の配列演算ユニット 40と通信することにより、移動を完了したデジタル画像 111の各帯域画素値に対して関数 Vi _{j k}( X , y )に従い近傍の平均値で埋める。これにより分離物体領域 143は正規化画像 145中の正規化領域 144に変換される。なお Xはデジタル画像 111となり、 yは物体領域画像 142となる。平均値で埋められた帯域画素値は正規化画像 145の帯域画素値として扱われる。ステップ 2 7 1 3で、ステップ 2 7 1 1からステップ 2 7 1 2までの繰り返し回数を表す補間回数が指定回数に達したかどうか判断する。もし補間回 Ifc^指定回数に達していなければ（ステップ 2 7 1 3 ： N〇）、ステップ 2 7 1 1に戻る。もし補間回数が指定回数に達していれば（ステップ 2 7 1 3 ： Y E S ) , ステップ 2 7 1 4に移行する。一般的に補間回数は近傍サイズ Qの半分程度の回数で十分である。

ステップ 2 7 1 4で、ステップ 2 7 0 6からステップ 2 7 1 3までの繰り返し回数を表す継続回数が指定回数に達したかどうか判断する。もし継続回数が指定回数に達していなければ（ステップ 2 7 1 4 ： N〇）、ステップ 2 7 0 6に戻る。もし継続回数が指定回数に達していれば（ステップ 2 7 1 4 ： Y E S ) , ステップ 2 7 1 5に移行する。なおこの指定回数はデジタル画像 1 1 1のサイズやデジタル画像 1 1 1の分離物体領域 1 4 3のサイズ、さらには近傍のサイズ Qにより決定される。利用目的に応じて適切なパラメ一夕を設定すれば、指定回数を大目に決定しても問題はないが、あまり指定回数を多くしすぎると、正規化に要する時間が長くなる。

ステップ 2 7 1 5で、正規化画像 1 4 5の帯域画素値を出力する。その後ステップ 2 7 0 3に戻る。

これにより、配列演算ユニット 4 0から構成されるデ一夕処理装置 1 1 0を用いて、領域正規化手段 2 7に対応する請求項 1 0記載の視覚装置が物体領域画像 1 4 2及びデジタル画像 1 1 1から正規化画像 1 4 5を生成することができる。

デ一夕処理装置 1 1 0によって実現される正規化画像保持手段 2 8 (第 7図参照）が正規化画像 1 4 5を記憶するために、格子状に配列された配列演算ュニット 4 0は同期して並列に動作する。格子上 i行 j列に配置された配列演算ュニット 4 0を AO U i j とすると、 AO U i j のアルゴリズムは第 2 6図のようになる。

ステップ 2 8 0 1で、 AOU _u を格子上の i行 j列に配置する。これは論理的であれ物理的であれ、 AO U i jの近傍を決定するために必要である。

ステップ 2 8 0 2で、 AOU ; j の近傍や変数の初期値を設定する。

ステップ 2 8 0 3で、順次入力される正規化画像 1 4 5が無くなつたかどうか判断する。もし正規化画像 1 4 5が無ければ（ステップ 2 8 0 3 ： Y E S )、アルゴリズムを終了する。もし正規化画像 1 4 5があれば（ステップ 2 8 0 3 ： NO )、ステップ 2 8 0 4 に移行する。ただし特定の画像サイズのみに対して配列演算ュニット 4 0を実装する場合には、無限ループにしても良い。

ステップ 2 8 0 4で、正規化画像 1 4 5の i行 j列の画素を帯域数分入力する。このため AO U i j は少なくとも帯域数分の画像デ一夕を記憶するメモリ 4 2を必要とする。ステップ 2 8 0 5で、出力先の装置が必要とすれば正規化画像 1 4 5のフォーマットを変換する。特に正規化画像 1 4 5の帯域数を 1にしたり、デジタル画像 1 1 1の帯域数が 4以上の場合に正規化画像 1 4 5の帯域数を 3にして、アナログ信号を生成しやすくする場合に便利である。さもなくば何もしない。

ステップ 2 8 0 6で、処理速度の異なる出力先の装置に画像データを確実に送信できるように、正規化画像 1 4 5の i行 j列の画素を記憶する。

ステップ 2 8 0 7で、正規化画像 1 4 5の帯域画素値を出力する。その後ステップ 2 8 0 3に戻る。

これにより、配列演算ユニット 4 0から構成されるデータ処理装置 1 1 0を用いて、正規化画像保持手段 2 8に対応する視覚装置が正規化画像 1 4 5を出力することができる。さて、ここまでは画像記憶手段 1 2 (第 1図及び第 6図参照）、画像振動手段 1 3 (第 3図、第 4図及び第 5図参照）、エッジ情報生成手段 1 4 (第 1図及び第 6図参照）、エツジ情報形成手段 1 5 (第 1図ないし第 5図、第 7図ないし第 1 2図参照）、物体背景分離手段 1 6 (第 2、 4、 5、 7図ないし第 1 2図参照）、位置/大きさ検出手段 1 7 (第 1図及び第 6図参照）、領域正規化手段 2 7 (第 7図参照）、及び正規化画像保持手段 2 8 (第 7図参照）のアルゴリズムを記述してきた。これらの手段は全て近傍処理によって実現できるので、これらの手段は格子状に配列した配列演算ュニット 4 0から構成されるデータ処理装置 1 1 0を用いることができた。しかしながら画像認識手段 2 9 (第 8図参照）近傍処理のみで実現することは困難である。そこで画像認識手段 2 9において、格子状に配列した配列演算ユニット 4 0から構成されるデータ処理装置 1 1 0が利用できるかどうか検討するために、画像認識手段 2 9の処理を詳しく分類する。

画像認識手段 2 9では、正規化画像 1 4 5 (第 2 4図参照）全体に渡って拡大された移動物体 2又は静止物体 3を事前に用意された候補の中から特定し、認識結果を生成することが求められる。移動物体 2又は静止物体 3を特定する最も基本的な方法は、移動物体 2 又は静止物体 3のテンプレート画像 1 4 6 (第 2 7図参照）を可能な限り多数用意して、正規化画像 1 4 5をテンプレート画像 1 4 6と比較することにより、正規化画像 1 4 5に最も似ているテンプレート画像 1 4 6を見つけ出することである。しかしながら画像認識手段 2 9は、正規化画像 1 4 5及びテンプレート画像 1 4 6から任意の画素を抽出して比較しただけでは、正規化画像 1 4 5に最も似ているテンプレート画像 1 4 6を見つけることができないので、正規化画像 1 4 5及びテンプレート画像 1 4 6の全画素を比較する必要がある。そのため画像認識手段 2 9は最小自乗法やニューラルネットワークなどの大域処理を必要とする。データ処理装置 1 1 0は近傍処理に適した構造をしているので、デー夕処理装置 1 1 0のみを用いて画像認識手段 2 9を実現することは難しい。

ところで画像認識手段 2 9は正規化画像 1 4 5から認識結果を生成する過程全般に渡つて大域処理をする必要はない。つまり正規化画像 1 4 5及びテンプレート画像 1 4 6から任意の画素を抽出して比較した結果から認識結果を生成する過程において画像認識手段

2 9は大域処理を必要とするが、正規化画像 1 4 5及びテンプレート画像 1 4 6から任意の画素を抽出して比較する過程において画像認識手段 2 9は必ずしも大域処理を必要としない。ここで正規化画像 1 4 5及びテンプレート画像 1 4 6から任意の画素を抽出して比較する過程は最も基本的なパターンマッチングとなるので、このパターンマッチングが近傍処理によつて実現できれば、このパターンマツチングの結果から認識結果を生成する過程のみを多数決など簡単な数値計算を実行する汎用プロセッサによって実現することができる。そこで以下では、データ処理装置 1 1 0によってパターンマッチングを実現する方法について説明する。

まず正規化画像 1 4 5を Xとし、 n個のテンプレート画像 1 4 6を y y ²、、、 y ^h、、、 y ⁿとする。自然数 gを用いると、マッチング結果画像 1 4 7の i 行 j 列のマッチング結果（5 _u は、数式 3 7に従って正規化画像 1 4 5及びテンプレート画 1 4 6の i 行 j 列の画素を比較し、正規化画像 1 4 5の画素に最も似ている画素を有するテンプレート画像 1 4 6の番号を指し示す。なおマッチング結果画像 1 4 7は単帯域画像となるので、便宜上帯域数 1の画像として取り扱うことにする。したがってマッチング結果 <5 i j iの第 3添字は 1となっている。

9 if ∑k (^ijk一 Vijkf = ^minl≤¾<n∑k (^ijk一 y,¾fc)²

Siji = ί τ 1 < g < n and only one of g, (37)

0 otherwise.

ここで数式 3 7に従って生成されたマッチング結果 δ i j 1はマッチング結果画像 1 4 7 全体において必ずしも統一されていない。テンプレート画像 1 4 6が多数ある場合、マツチング結果画像 1 4 7はむしろモザイク状になる可能性が高い。そこでデータ処理装置 1 1 0がマッチング結果 δ i j i とその Q近傍内のマッチング結果に対するヒストグラムを計算し、マッチング結果 <5 i j を収斂する方法を以下に示す。

任意の単帯域画像 Xがマッチング結果画像 1 4 7である場合、自然数 g、実数 uと V を用いると、マッチング画像 1 7 2は数式 3 8及び 3 9に従って更新される。なおマッチング結果画像 1 4 7は単帯域画像となるので、便宜上帯域数 1の画像として取り扱うことにする。したがって関数 ^ _{U 1} ( X )の第 3添字は 1となっている。

i (x) ₁ (38)

1 if u = ·υ,

eq(u, v)― (39)

0 otherwise. マッチング結果画像 1 4 7が変化しなくなるまでデータ処理装置 1 1 0が数式 3 8及び

3 9を繰り返し計算することにより、マッチング結果画像 1 4 7全体のマッチング結果を収斂することができる。このとき正規化画像 1 4 5とテンプレート画像 1 4 6の組み合わせにより、マッチング結果は次のように収斂する。もし正規化画像 1 4 5の約半分の画素が特定のテンプレート画像 1 4 6の画素に最も類似していれば、マッチング結果画像 1 4 7の殆んどのマッチング結果はこの特定のテンプレート画像 1 4 6の番号に収斂する。しかしながら正規化画像 1 4 5の幾つかの画素の塊が幾つかの異なるテンプレート画像 1

4 6の画素の塊と類似していれば、マッチング結果画像 1 4 7には 0で囲まれた幾つかのテンプレート画像 1 4 6の番号の塊ができる。さらに正規化画像 1 4 5がテンプレート画像 1 4 6の集合と相関がなければ、マッチング結果画像 1 4 7のマッチング結果は殆んど 0となる。したがってデ一タ処理装置 1 1 0によって実現されるパターンマッチングは、正規化画像 1 4 5に最も似ているテンプレート画像 1 4 6を特定することは難しいが、テンプレート画像 1 4 6の中から幾つかの似ているテンプレート画像 1 4 6を選択することができると考えられる。そこでパターンマッチングの結果から認識結果を生成する過程では、パターンマッチングによって生成されたマッチング結果画像 1 4 7が列挙するテンプレート画像 1 4 6の類似候補の中から、最も有力な候補 1つを選択するだけで良い。第 2 7図に示すように、データ処理装置 1 1 0によって実現される請求項 1 1記載のパ夕一ンマッチングが、テンプレート画像 1 4 6のうち正規化画像 1 4 5に最も似ている画像の番号を示すマッチング結果から構成されるマッチング結果画像 1 4 7を生成するために、格子状に配列された配列演算ュニット 4 0は同期して並列に動作する。格子上 i行 j 列に配置された配列演算ユニット 4 0を AOU ; j とすると、 A〇U i』のアルゴリズムは第 2 8図のようになる。

ステップ 2 9 0 1で、 AO U i j を格子上の i行：)'列に配置する。これは論理的であれ物理的であれ、 AOU i jの近傍を決定するために必要である。

ステップ 2 9 0 2で、 AOU i j の近傍や変数の初期値を設定する。近傍の設定においては、前記各関数で使う近傍サイズ Qを個別に決めても良いし、全部を統一しても良い。本発明のデータ処理装置 1 1 0が生成したマッチング結果画像 1 4 7の正確さを上げるためには近傍サィズ qを全て大きな値に設定することが望ましい。しかしながらマッチング結果を更新するための計算時間の制約や、入力される正規化画像 1 4 5のサイズなどにより、パターンマッチングは必要に応じて適宜近傍サイズを変えることで対処することがでさる。

ステップ 2 9 0 3で、順次入力されるテンプレート画像 1 4 6が無くなつたかどうか判断する。もしテンプレート画像 1 4 6が無ければ（ステップ 2 9 0 3： Y E S )、ステップ 2 9 0 5に移行する。もしテンプレート画像 1 4 6があれば（ステップ 2 9 0 3 : NO ) , ステップ 2 9 0 4に移行する。

ステップ 2 9 0 4で、テンプレート画像 1 4 6の i行 j列の画素を帯域数分入力する。このため A〇U i jは少なくとも帯域数とテンプレート画像 1 4 6の数を掛けた分の画像デ一夕を記憶するメモリ 4 2を必要とする。その後ステップ 2 9 0 3に戻る。

ステップ 2 9 0 5で、順次入力される正規化画像 1 4 5が無くなつたかどうか判断する。もし正規化画像 1 4 5が無ければ（ステップ 2 9 0 5 ： Y E S ) , アルゴリズムを終了する。もし正規化画像 1 4 5があれば（ステップ 2 9 0 5 ： NO ) , ステップ 2 9 0 6 に移行する。ただし特定の画像サイズのみに対して配列演算ュニット 4 0を実装する場合には、無限ループにしても良い。

ステップ 2 9 0 6で、正規化画像 1 4 5の i行 j列の画素を帯域数分入力する。このため AOU i jは少なくとも帯域数分の画像データを記憶するメモリ 4 2を必要とする。ステップ 2 9 0 7で、正規化画像 1 4 5とテンプレート画像 1 4 6からマッチング結果画像 1 4 7のマッチング結果 δ を計算する。マッチング結果は正規化画像 1 4 5に最も近いテンプレート画像 1 4 6の番号を表す帯域画素値となる。

ステップ 2 9 0 8で、 AOU i jが近傍の配列演算ユニット 4 0と通信することにより、マッチング結果画像 1 4 7の各帯域画素値に対して関数 j x )に従いマッチング結果を更新する。更新された帯域画素値は再びマッチング結果画像の帯域画素値として扱われる。ここで関数 Ψ；』（ X )は本来マッチング結果画像 1 4 7の帯域画素値が変化しなくなるまで繰り返される。ただし計算時間の制約、入力される正規化画像 1 4 5の品質、更新されたマッチング結果画像 1 4 7に求められる品質などにより、更新処理は適当な繰り返し回数で計算を打ち切った方が良い。

ステップ 2 9 0 9で、マッチング結果画像 1 4 7の帯域画素値を出力する。その後ステツプ 2 9 0 5に戻る。

これにより、配列演算ユニット 4 0から構成されるデータ処理装置 1 1 0を用いて、画像認識手段 2 9中のパターンマッチングに対応する請求項 1 1記載の視覚装置は正規化画像 1 4 5からマッチング結果画像 1 4 7を生成することができる。

ここまでは配列演算ユニット 4 0から構成されるデ一夕処理装置 1 1 0を用いて、近傍処理のみからなる画像処理を行う方法について説明してきた。以下では配列演算ュニット 4 0から構成されるデータ処理装置 1 1 0を用いて、近傍処理のみで物体 Z背景分離手段 1 6 (第 2図及び第 7図参照）を実現する請求項 1 1記載の視覚装置について説明する。まず非線形振動子は一般に引き込み現象を起こす。この引き込み現象とは、リミットサイクルゃァトラクタなどのような周期的挙動において、異なる周期を持つ非線形振動子が相互作用して簡単な定数比の周期で振動するよう制約される現象である。このとき 1つの非線形振動子の振動を変化させると他の非線形振動子の振動も合わせて変化するので、これらの非線形振動子は同期している。しかも非線形振動子の相互作用を調整することにより、お互いの振動の位相差を極力小さくさせたり大きくさせたりできる。そこでこの相互作用を操作すると、非線形振動子の一群を、異なる位相を持つ複数のグループに分割することができる。物体 Z背景分離手段 1 6はこのような非線形振動子の引き込み現象を利用して、エッジ情報画像中のエッジ情報を境界とするように物体と背景を分離して、物体領域を表す物体領域画像を生成する。なお、ここでは非線形振動子としてファン ·デル · ポールを用いた場合を例に説明する。

まず、格子状に配列した非線形振動子から構成される非線形振動子ネットワークにおいて、 i行： i列にある非線形振動子を ω i』とすると、非線形振動子 i j の q近傍にある非線形振動子の集合は数式 4 0によって表される。ただし qは 4、 8、 2 4、 48、 80、 120、（2 r + 1 )²— 1 と続く数列であり、 rは自然数である。なおネットワークサイズをはみ出した非線形振動子が近傍集合 Ω; j(q)に含まれる場合には、非線形振動子 O j を代用するものとする。これにより辺縁処理は自動的に行われる。したがって近傍集合 Q)の要素の数は常に Qとなる。なおこのことから判る通り、非線形振動子ネットワークは単帯域画像と同じ扱いになる。表現を簡単にするため、非線形振動子ネットワークでは添字は幅方向と高さ方向の 2つのみを使う。

{^ωί+1,3^ ^ω +1， ^ωί,3~ΐ}

if g = 4,

(40)

{^i,m \i-r < l < i + r, j一 r < m < j + r, ≠

if ρ = (2r + l)²一 1.

次に、非線形振動子は Q _a近傍に含まれる近傍集合 Ω i j ( Q _a )にある非線形振動子との間で数式 41に従い計算される結合値て i _{j kl} によって結合される。なお対数表を用いない場合には数式 42による近似も可能である。また^、は適当な正の定数である。

Tijki = μ sin ^ ) for Y _k! G Ω_ϋ(ς_α) (41)

1一 2|rc|² + | |³ if0< jxj < 1,

sinc( ) ¾ 4 - 8|a:| + 5|a;|² - | |³ if 1 < |a;| < 2, (42) 0 otherwise.

非線形振動子ネットワークの全ての非線形振動子が完全に同位相で同期した場合、プロセッサで計算する限り、非線形振動子 C i j は永久に同位相のまま動作し続けてしまう。そこで外乱 p； jを与えればこのような状態を回避することができる。外乱としては疑似乱数を用いることもできるが、数式 43のような簡単な式で求めても十分である。なお ζ； jはエッジ情報画像の i行 j列のエッジ情報の有無を表す。エッジ情報があれば 1とし、なければ 0とする。また κは適な IEの定数である。

非線形振動子 ω i jが近傍集合 Ω i j ( Q _a )の非線形振動子 ω _k ! と同期するために数式 4 4に従い近傍入力合計ひ i j を計算する。

Oij = L ' 一

一 ξί]) (44) ファン 'デル ·ポール非線形振動子 ω i j を構成する 2つのパラメータ φ〖〗と _u は数式 4 5と数式 4 6に従って計算される。なおァ、 εは適当な正の定数である。 dcthj ,

= (⁴⁵)

- = -ΊΦϋ - 1 - Φ%) +び + Ρϋ (46) 非線形振動子を物体領域と背景領域に分離するためには全ての非線形振動子の位相のずれを計算する必要があるが、単純に物体領域と背景領域の 2つに分離するだけであるので、パラメ一夕 ₅ jがしきい値 0以上か未満かで位相ずれを計算する。物体領域と背景領域を分離した結果を出力する出力 λ i jは数式 4 7によって求められる。なお øは適当な正の定数である。

1 if > Θ,

ij― ― (47) 0 otherwise.

ェッジ情報が物体と背景を分離するのに不十分であつた場合にはェッジ情報を補間しなければならない。そのために非線形振動子 ω _uの Q _b近傍にある非線形振動子の集合 Ω i j ( q _b )中でいくつの非線形振動子が位相ずれを起こしているか求める必要がある。そこで数式 4 8によって輪郭パラメ一夕 V i j を計算する。

= ∑ (48) この結果を基にエッジ情報の補間割合を示す境界パラメータ έ i j を数式 4 9によつ„て計算する。なお α、 β、 7? _{m i n}、 77 _{m a x}は適当な正の定数である。一ひ ii η

(49) n i β(1― ξ^) otherwise.

ここでは非線形振動子としてファン 'デル 'ポールの場合を説明したが、この他にブラッセレー夕のようなリミットサイクルで安定する非線形振動子や、ローレンツアトラク夕やレスラー方程式のァトラクタを発生するカオス振動子など、引き込み現象を起こす任意の非線形振動子でも動作可能である。その場合はパラメ一夕 Φ i j とゆ i jを各々の非線形振動子のパラメ一夕で置き換えるなり追加すれば良い。その際に適当なパラメ一夕に近傍入力合計ひ i〗と外乱 P i j を加えるだけである。但し、カオス振動子の場合には特に外乱 p i j を必要としない。

数式 4 0から数式 4 9までを用いることにより、物体 Z背景分離手段 1 6 (第 2図及び第 7図参照）を実装することができるデータ処理装置 1 1 0の全ての配列演算ュニット 4 0のアルゴリズムを記述することができる。以下では、データ処理装置 1 1 0中の任意の配列演算ュニッ卜 4 0のァルゴリズムを用いて、物体背景分離手段 1 6に対応する請求項 1 2記載の視覚装置について説明する。

第 2 9図に示すように、データ処理装置 1 1 0によって実現される物体背景分離手段 1 6が形成された三角形のエッジ情報 1 5 1を用いて三角形の内側領域 1 5 2と三角形の外側領域 1 5 3に分離するために、格子状に配列された配列演算ュニット 4 0は同期して並列に動作する。格子上 i行 j列に配置された配列演算ュニット 4 0を A〇U i j とすると、 AOU i』のアルゴリズムは第 3 0図のようになる。

ステップ 1 6 0 1で、 AOU i j を格子上の i行 j列に配置する。

ステップ 1 6 0 2で、数式 4 1及び 4 2に基づいて近傍同士 0) _U と c _{k l} を結合値て i _{j k} iで接続する。

ステップ 1 6 0 3で、非線形振動子のパラメ一夕 Φ i j と i】に適当な初期値を設定する。

ステップ 1604で、順次入力される形成エッジ情報画像 115が無くなつたかどうか判断する。もし形成エッジ情報画像 115が無ければ（ステップ 1604： YES)、ァルゴリズムを終了する。もし形成エッジ情報画像 115があれば（ステップ 1604： N 0)、ステップ 1605に移行する。ただし特定の帯域数及び画像サイズのみに対して配列演算ュニット 40を実装する場合には、無限ループにしても良い。

ステップ 1605で、形成エッジ情報 114の ζ _u を入力する。

ステップ 1606で、直前に入力した形成エッジ情報 1 14の ζ i jから数式 43に従って外乱 p i jを計算する。

ステップ 1607で、近傍集合 Q_u(Q_a)中の非線形振動子 w_{k l}がある配列演算ュニット 40の A〇U_{k l}から ζ _kい ξ _kい _{k l} を入力して、合計値ひ i j を数式 44 に従って計算する。

ステップ 1608で、非線形振動子のパラメ一夕 Φ i j、 _u を数式 45及び 46に従って計算する。即ち、これらの数式に示す微分方程式をルンゲ ·クッ夕法で解く。ステップ 1609で、非線形振動子の出力 λ； jを数式 47に従って計算する。ここで、 -_{ι }}≥ θであれば λ _u = 1 とし、それ以外であれば久 i j = 0とする。

ステップ 1610で、近傍集合 j(q_b)中の非線形振動子 co_kiがある配列演算ュニット 40の AOU_{k l}から A_{k l} を入力して、輪郭パラメータ η _{s 3} - を数式 48に従つて計算する。

ステップ 1611で、境界パラメ一夕 ξ i jを数式 49に従って計算する。即ち、この数式に示す微分方程式を差分法若しくはルンゲ ·クッタ法で解く。

ステップ 1612で、ステップ 1606からステップ 1611までの繰り返し回数を表す分離回数が指定回数に達したかどうか判断する。もし分離回数が指定回数に達していなければ（ステップ 1612 : N〇）、ステップ 1606に戻る。もし分離回数が指定回数に達していれば（ステップ 1612 ： YES)、ステップ 1613に移行する。

ステップ 1613で、物体領域画像 142の帯域画素値となる非線形振動子の出力 λ i j を出力する。その後ステップ 1 6 0 4に戻る。

なおステップ 1 6 1 2での分離回数を求めるには、次のような方法を用いることができる。物体/背景分離手段 1 6では、画像サイズが一定であれば非線形振動子の初期状態に関わらずおおよそ全ての形成エッジ情報 1 1 4においてある一定時間で分離が終了するので、事前にこの時間を計っておいてステップ 1 6 0 6からステップ 1 6 1 1までの繰り返し回数を求めておけば良い。これは非線形振動子の初期状態が一定の範囲内にあれば、引き込み現象により非線形振動子が同期するまでの時間はあまり大差がないからである。このように非線形振動子を計算するだけで、形成された三角形のエッジ情報 1 5 1を用いて三角形の内側領域 1 5 2と三角形の外側領域 1 5 3を分離することができるのは、非線形振動子の性質である引き込み現象を利用しているからである。つまり、 2つの非線形振動子を正の結合値で結合した場合は同位相になろうとし、負の結合値で結合した場合は位相差が極力大きくなろうとする。この性質を用いると、格子状に並んだ非線形振動子を近傍同士正の結合値で結合することで、直接結合していない非線形振動子同士が同位相になる。さらに形成エッジ情報 1 1 4を挟む画素の場所にある非線形振動子同士を負の結合値で結合すると、エッジ情報の両側がお互いに位相を極力ずらし合う。このようにすることで、全ての非線形振動子を結合することもなく三角形のエッジ情報 1 5 1の内側と外側とで各々異なる位相集合ができる。したがって物体 Z背景分離手段 1 6は第 2 9図のような三角形の内側領域 1 5 2と三角形の外側領域 1 5 3に分離する。このとき三角形の内側領域 1 5 2と三角形の外側領域 1 5 3の位相差は 9 0度を越えて可能な限り 1 8 0度に近づき、三角形と背景領域が分離できる。

ここで重要なことは、本実施形態では、形成エッジ情報 1 1 4が得られる度に次に示すような方法で結合値を擬似的に変更していることである。まず数式 4 1及び 4 2で定めたように、非線形振動子 c _k！を非線形振動子 ω； j に結合するための結合値をて i』 _k！とする（ステップ 1 6 0 2参照）。形成エッジ情報 ζ u と ζ _{k l} は共に、エッジがある場合には 1、ない場合には 0である。形成エッジ情報と £ _{k l} を入力したら（ステップ 1 6 0 5参照）、配列演算ユニット 4 0の A〇U _k iから AO U i j に形成エッジ情報 ζ _{k l}が転送され、 A〇U i jでは結合値 r _{i j k l} ( 1 - k i ) を計算して結合値て _{k l} の代用とする（ステップ 1 6 0 7参照）。この代用された結合値 r i _{j k} i ( 1一 ζ _k i ) に対して境界パラメ一夕 € i jが 0から 1までの倍率として作用する（ステップ 1 6 0 7参照)。 - 第 3 1図に示す通り、形成エッジ情報 1 1 4が破線状態の三角形のエッジ情報 1 5 4となった場合には破線の補間をする必要がある。まず初めに破線状態の三角形のエッジ情報 1 5 4を用いてシステムを動作させる（ステップ 1 6 0 5参照）と、破線状態の三角形のエッジ情報 1 5 4の内側と外側で位相差がおよそ 9 0度を越えるようになるが、三角形の内側と外側の境界部分は不明確である。そこで各 A O U i jが非線形振動子の出力 λ i j を計算する（ステップ 1 6 0 9参照）。この出力 λ i jが 1の場合、近傍の非線形振動子のうちえが 1である非線形振動子を c _k i とすると、パラメ一夕ゆ _u と _{k l}が共に Θ以上となる。つまり λ _u とえはおよそ同位相であり、 Θが正値であれば最悪でも位相差が 9 0度を越えることはない。この位相差の最大値は Θの値によって決まり、 λ i _} - と A _{k l}が共に 1となる範囲で Θを大きくしていくと、この位相差は 0度に近づいていく。したがって λ i j とえと用いると、近傍の非線形振動子うちおよそ同位相であるものの数を表す輪郭パラメータ V i jは数式 4 8に従って計算される（ステップ 1 6 1 0参照）。続いてこの輪郭パラメ一夕 V I jが近傍全体のうち、およそ半分であれば結合値の倍率である境界パラメ一夕 i j を数式 4 9に従って減少させ、それ以外であれば数式 4 9に従って増加させる（ステップ 1 6 1 1参照）。例えば、 8近傍の場合は 3から 5 の間であれば数式 4 9に従って境界パラメ一夕を減少させるとよい。この過程を繰り返し動作させ続けると、第 3 1図に示す破線状態の三角形のエッジ情報 1 5 4が与えられた場合、破線三角形の内側領域 1 5 5と破線三角形の外側領域 1 5 6に分離される。

第 3 2図に示す通り、 2つの三角形が重なりあっている場合は、前方の三角形のエッジ情報 1 5 7と後方の三角形のエッジ情報 1 5 8が得られる。このとき前方三角形の内側領域 1 5 9と後方三角形の内側領域 1 6 0と二重三角形の背景領域 1 6 1の 3つの領域の非線形振動子の位相がお互いにずれることにより、 3つの領域に分離される。また第 3 3図に示す通り、 2つの重なった円形のエッジ情報 1 6 2が破線であっても、前方円形の内側領域 1 6 3と後方円形の内側領域 1 6 4と二重円の背景領域 1 6 5の 3つに分離される。これにより、配列演算ユニット 4 0から構成されるデータ処理装置 1 1 0を用いて、物体ノ背景分離手段 1 6に対応する請求項 1 2記載の視覚装置は形成エッジ情報画像 1 1 5 の形成エッジ情報 1 1 4を境界として物体領域 1 4 1と背景を分離することができる。ここまで請求項 6から請求項 1 2までに記載された視覚装置について説明してきた。当然のことながらこれらの視覚装置は汎用のコンピュータによつて実装することができるが、移動物体 2を計数の対象とする場合、移動物体 2の移動速度によっては前記手段の各々を高速に実行する必要がある。特にフレーム画像 1の画像サイズ若しくは解像度を上げたとき、画像自体を処理対象とする画像記憶手段 1 2 (第 1図及び第 6図参照）、画像振動手段 1 3 (第 3図、第 4図及び第 5図参照）、エッジ情報生成手段 1 4 (第 1図及び第 6図参照）、エッジ情報形成手段 1 5 (第 1図ないし第 5図、第 7図ないし第 1 2図参照）、物体ノ背景分離手段 1 6 (第 2、 4、 5、 7図ないし第 1 2図参照）、位置,大きさ検出手段 1 7 (第 1図及び第 6図参照）、領域正規化手段 2 7 (第 7図参照）、正規化画像保持手段 2 8 (第 7図参照）及び画像認識手段 2 9 (第 8図参照）は、幅方向及び高さ方向の各々に対して画像サイズ若しくは解像度に比例して計算量が増大する。したがつて請求項 6から請求項 1 2までに記載された視覚装置は用途によっては望みうる性能を達成できない可能性がある。

そこでデジタル技術を用いて画像記憶手段 1 2、画像振動手段 1 3、エッジ情報生成手段 1 4、エッジ情報形成手段 1 5、物体 Z背景分離手段 1 6、位置 Z大きさ検出手段 1 7、領域正規化手段 2 7、及び正規化画像保持手段 2 8を実装するために、請求項 1 3記載の配列演算ュニット 4 0はデータ処理装置 1 1 0中で第 1 3図のように格子状に配列され、さらに配列演算ュニット 4 0はデータ処理装置 1 1 0中の隣接する配列演算ュニット 4 0だけと相互に通信できるように配線される。つまり 4近傍同士が直接配線されることになる。これにより 8近傍同士を配線する場合に比べて、少ない電子部品と配線量で、同程度に高速に動作し、しかも将来近傍サイズを拡張する場合にも簡単に拡張性を有することができる。

請求項 1 4記載の配列演算ュニット 4 0は第 3 4図に示す通り、画像処理における数式を計算するためのプロセッサ（PROCESSOR) 4 1と、数式で使われる全てのパラメ一夕、定数、関数及びオペレータを記憶するためのメモリ（MEMORY) 4 2と、近傍の配列演算ユニット 4 0と通信するためのコント口一ラ（CONTROLER) 4 3から構成され、プロセッサ 4 1はアドレスバス 5 1で指定したアドレス（ADDRESS) によりメモリ 4 2 及びコントローラ 4 3の任意のメモリ素子及びレジス夕を選択することができる。またプ口セッサ 4 1はデータバス 5 2を介してメモリ 4 2及びコントローラ 4 3と双方向に通信可能に接続され、アドレスバス 5 1で指定された任意のメモリ素子及びレジス夕のデータ (DATA) にアクセスすることができる。配列演算ユニット 4 0が 1つ以上の入力画素から構成される前入力データ群（FRONT INPUT DATA SET) を入力すると、コント口一ラ 4 3は前入力データ群をメモリ 4 2に記憶させる。またコントローラ 4 3は、関数により作成されたメモリ 4 2中の計算データを隣接する配列演算ュニッ卜 4 0に送信すると共に、隣接する配列演算ユニット 4 0から受信した計算データをメモリ 4 2に記憶させ、さらに必要ならば、入力した以外の配列演算ユニット 4 0に転送する。最終的にコントローラ 4 3は、出力画像の画像データを結果データ（RESULT DATA) として出力する。このように各配列演算ュニット 4 0にコントローラ 4 3を搭載する理由は、配列演算ュニット 4 0同士が通信している間にプロセッサ 4 1が動作できるので、プロセッサ 4 1は通信による待ち時間中にも計算することができて高速処理が実現できるからと、近傍の配列演算ュニット 4 0の数を変化させてもハードウェアを変更する必要もないからと、コントローラ 4 3が画像の辺縁処理、つまり画像中の縁の画素に対する例外処理を自動的に行えるので、プロセッサ 4 1のプログラムは辺縁処理をする必要がなくなり極めて単純になるからである。

プロセッサ 4 1とメモリ 4 2は汎用的なデジタル回路を用いることができる。コントローラ 4 3の具体的な回路図は第 3 5図に示す通りである。アドレスバッファ（ADDRESS BUFFER) 5 3はアドレスバス（ADDRESS BUS) 5 1を介してプロセッサ 4 1からァドレス（ADDRESS) を受取り、アドレスデコーダ（ADDRESS DECODER) 5 4によつて各レジスタ及びその他の機能ブロックを選択する。データバッファ（DATA BUFFER) 5 5はデ一夕バス（DATA BUS) 5 2を介してプロセッサ 4 1からデータ（DATA) を受取り、アドレスデコーダ 5 4で選択されたレジスタと内部データバス 5 6を介して排他的に通信する。通信方向は読み出し（READ) によって指定される。アドレスがフラグレジスタ（FLAG REGISTER) 5 7を指定した場合、データはフラグレジス夕 5 7に記憶され、フラグデコーダ（FLAG DECODER) 5 8によってデコードされ、複数信号 (SIGNALS) として隣接する配列演算ユニット 4 0に送信される。複数信号はフラグェンコーダ（FLAG ENCODER) 5 9によって受信され、解析された後にステータスレジス夕 (STATUS REGISTER) 6 0に記憶され、また受領（RECEIVE) として送信元の配列演算ユニット 4 0に返送される。受領は複数信号の送信元のフラグエンコーダ 5 9で受信され、結果として複数信号の送信完了が確認される。アドレスによってステータスレジス夕 6 0が選択されると、ステータスレジス夕 6 0の内容がデ一夕バス 5 2を介してデ一夕としてプロセッサ 4 1に送信される。 1つ以上の入力画像（INPUT IMAGE) に対応した 1 つ以上の前入力送達（FRONT INPUT SEND) をフラグエンコーダ 5 9が受信すると 1 つ以上の入力画像からなる前入力データ群（FRONT INPUT DATA SET)が必要な記憶容量分用意された前入力データレジスタ 6 1 (FRONT INPUT DATA REGISTER) に読み込まれる。アドレスによって前入力データレジス夕 6 1が選択されると、前入力データレジスタ 6 1の内容がデータとしてプロセッサ 4 1に送信される。プロセッサ 4 1が計算を完了したら、アドレスによつて結果データレジスタ（ RESULT DATA REGISTER) 6 2が選択され、結果データレジスタ 6 2が出力画像の画像データを結果データ（RESULT DATA) として読み込む。これと同時に、フラグエンコーダ 5 9が結果送達（RESULT SEND) を送信する。

近傍の配列演算ュニット 4 0から計算に必要なデータを求められたら、アドレスとして出力データレジスタ 6 3 (OUTPUT DATA REGISTER) を選択し、近傍の配列演算ュニット 4 0に送信すべきデータを計算デ一夕（CALCURATION DATA) として出力デ一夕レジス夕 6 3に読み込む。その後、隣接する全ての配列演算ュニット 4 0に計算データとして送信される。上側の配列演算ユニット 4 0から複数信号（SIGNALS) を受信したら計算データを上入力データレジス夕（UPPER INPUT DATA REGISTER) 6 4に読み込む。その後、アドレスにより上入力データレジスタ 6 4が選択されたら、上入力デ一夕レジスタ 6 4の内容が計算データとして送信される。下側、左側、右側の配列演算ュニット 4 0から複数信号を受信した場合も同様であり、下入力データレジスタ 6 5、左入力データレジス夕 6 6、右入力データレジスタ 6 7が同様に動作する。

各種バッファ、各種レジスタ、アドレスデコーダ 5 4の各ブロックは汎用的な電子回路である。フラグデコーダ 5 8とフラグエンコーダ 5 9は具体的には第 3 6図と第 3 7図に示すような入出力信号を有する。種別（TYPE) は出力デ一夕レジスタ 6 3 (OUTPUT DATA REGISTER) に読み込まれた内容の種類を 5ビットで表す。このビット数は配列演算ュニッ卜 4 0が送受信すべき全ての計算データを区別するのに十分な値である。カウントー X (COUNT-X) 及びカウント—Y (COUNT-Y) は各々 4ビットの符号なし整数を表し、配列演算ュニット 4 0の間の転送回数を示す。配列演算ュニット 4 0が計算デー夕を送信する場合には各々のカウントが 0となり、左右の配列演算ュニット 4 0から送信された計算データを再度送信する場合にはフラグエンコーダ 5 9のカウント一に 1を足した値となり、上下の配列演算ュニット 4 0から送信された計算デ一夕を再度送信する場合にはフラグエンコーダ 5 9のカウント一 Yに 1を足した値となる。プロセッサ 4 1がフラグレジスタ 5 7の送達フラグ（SEND FLAG) に上下左右のうちどの方向に出力デ一夕レジスタ 6 3の内容を送信するかを指定した後で、出力デ一夕レジスタ 6 3を指定するアドレスデコーダ 5 4の中央デコーディング（CENTRAL DECODING) をフラグデコーダ 5 8が受信すると、フラグデコーダ 5 8が送達 (SEND) を送達フラグの指定方向に合わせて出力する。送達フラグは 4ビットで表し、配列演算ユニット 4 0の計算データを四方の配列演算ュニット 4 0に送信する場合にはプロセッサ 4 1が 1 1 1 1と設定し、右側の配列演算ュニット 4 0から送信された計算データを上下左側に転送する場合はプロセッサ 4 1が 1 1 1 0と設定し、左側から上下右側に転送する場合は 1 1 0 1と設定し、下側から上側に転送する場合は 1 0 0 0と設定し、上側から下側に転送する場合は 0 1 0 0と設定する。これにより、転送に重複がなくなり効率的に転送できるだけでなく、転送方向の決定規則が明確になっているので、種別、カウント— X及びカウント— Yを組み合わせることにより、フラグエンコーダ 5 9はどの配列演算ユニット 4 0からどの種別の計算デ一夕が送信されたかを判定することができる。結果データレジスタ 6 2に計算デー夕が結果デ一夕として読み込まれると同時にフラグデコーダ 5 8は、結果デコーディング (RESULT DECODING) を受信し、結果送達 (RESULT SEND) を送信する。

フラグエンコーダ 5 9は四方のうちいずれかでも送達を受信したら、受信方向の種別とカウント一 X、カウント一 Yを受信し、その部分のステータスレジスタ 6 0の内容を更新する。この更新と同時に受信方向に受領を 1にして送信する。送信元の配列演算ュニット 4 0のフラグエンコーダ 5 9では受領が 1になった瞬間に受信し、ステータスレジス夕 6 0の受領ステータス（RECEIVE STATUS) を更新する。これにより各配列演算ュニット 4 0ではプロセッサ 4 1がステータスレジス夕 6 0の受領ステータスを検査するだけで、どの入力データレジス夕に有効な計算デ一夕が記憶されているか判断することができる。そこで例えば上入力データレジス夕 6 4に計算データが読み込まれていれば、プロセッサ 4 1がアドレスを指定することにより上入力データレジスタ 6 4からデ一夕を読み込むことができるが、同時にアドレスデコーダ 5 4から上デコーディング (UPPER DECODING) がフラグエンコーダ 5 9に送信され、受領ステータスのうち上部分が 0に戻され、上側に向いた受領が 0として送信される。下左右側の場合も同様に動作する。フラグエンコーダ 5 9が 1つでも入力画像用の前入力送達を受信したら、ステータスレジス夕 6 0のうち受信した前入力送達に対応する入力画像用の前入力送達ステ一タス（FRONT INPUT SEND STATUS) を 1にする。またプロセッサ 4 1が入力画像用の前入力データレジス夕 6 1からデ一夕を読み込むとき、アドレスデコーダ 5 4がフラグエンコーダ 5 9に前デコーディング（FRONT DECODING) を送信し、受信した前入力送達に対応する前入力送達ステータスを 0にする。プロセッサ 4 1はステータスレジス夕 6 0の内容を読み込むことにより、前入力デ一夕レジスタ 6 1に最新の入力画像が記憶されているかどうか判断することができる。

プロセッサ 4 1がコントローラ 4 3を介して四方の配列演算ユニット 4 0に計算データを送信する場合のアルゴリズムを第 3 8図に示す。第 3 8図は、プロセッサ 4 1によるプログラム制御と、フラグデコーダ 5 8及びフラグエンコーダ 5 9によるハードウェア口ジックとの混成による処理を示すものである。第 3 8図に対して、ステップ 7 1では、プ口セッサ 4 1がステータスレジス夕 6 0の内容を読み込む。ステップ 7 2では、読み込んだ内容のうち受領ステータスが全て 0であるか否かを判断する。 N Oなら処理を終了する。 Y E Sならステップ 7 3に移行する。ステップ 7 3では、プロセッサ 4 1が隣接する配列演算ユニット 4 0に送信するデータの種別とカウン夕と送信方向を決定し、その内容をフラグレジス夕 5 7に書き込む。ステップ 7 4では、プロセッサ 4 1が隣接する配列演算ユニット 4 0に送信するデータを出力データレジスタ 6 3に書き込む。ステップ 7 5では、出力データレジスタ 6 3の内容を計算データとして、隣接する配列演算ユニット 4 0 に送信する。ステップ 7 6では、フラグレジスタ 5 7の送達フラグで指定された方向にのみ送達を 1にして送信する。これによりプロセッサ 4 1の 1回の送信アルゴリズムは終了する。プロセッサ 4 1は、送信すべきデ一夕がメモリ 4 2内で更新される度にこの送信ァルゴリズムを開始する。

コントローラ 4 3が上側の配列演算ユニット 4 0から計算データを受信する場合のアルゴリズムを第 3 9図に示す。第 3 9図は、フラグデコーダ 5 8及びフラグエンコーダ 5 9 によるハードウェアロジックによる処理を示すものである。第 3 9図に対して、ステップ 8 1では、フラグエンコーダ 5 9が送達を入力する。ステップ 8 2では、送達が 1であるか否かをフラグエンコーダ 5 9が判断する。 N Oなら処理を終了する。 Y E Sならステツプ 8 3に移行する。ステップ 8 3では、上入力デ一夕レジスタ 6 4が上側から送信された計算データを読み込む。ステップ 8 4では、フラグエンコーダ 5 9がステータスレジスタ 6 0のうち上側用の受領ステータスを 1にすると同時に受領を 1にして上側の配列演算ユニット 4 0に送信する。下左右側の場合も同様である。これによりコントローラ 4 3の 1回の受信アルゴリズムは終了する。コントローラ 4 3は常時上下左おの配列演算ュニット 4 0からの送達を監視し、この送達を受信する度にこの受信アルゴリズムを開始する。プロセッサ 4 1が上入力データレジスタ 6 4からデ一夕を受信する場合のアルゴリズムを第 4 0図に示す。第 4 0図は、プロセッサ 4 1によるプログラム制御と、フラグデコ一ダ 5 8及びフラグエンコーダ 5 9によるハードウェアロジックとの混成による処理を示すものである。第 4 0図に対して、ステップ 9 1では、プロセッサ 4 1がステータスレジス夕 6 0の内容を読み込む。ステップ 9 2では、読み込んだ内容のうち上側用の受領ステ一タスが 1であるか否かを判断する。 NOなら処理を終了する。 Y E Sならステップ 9 3に移行する。ステップ 9 3では、プロセッサ 4 1が上入力データレジスタ 6 4からデ一夕を読み込む。ステップ 9 4では、フラグエンコーダ 5 9がステータスレジスタ 6 0のうち上側用の受領ステータスを 0にすると同時に受領を 0にして上側の配列演算ュニット 4 0 に送信する。下左右側の場合も同様である。これによりプロセッサ 4 1の 1回の受信アルゴリズムは終了する。プロセッサ 4 1は一定間隔でステータスレジス夕 6 0の内容を監視し、上下左おいずれかの受領ステータスが 1である度にこの受信アルゴリズムを開始する。またプロセッサ 4 1が一定間隔でステータスレジス夕 6 0の内容を監視しなくても、割り込み処理により実装することもできる。

なおこの配列演算ユニット 4 0は、主に 1つ以上の入力画像から 1つの出力画像を生成することを前提に記述したが、用途に応じては計算途中の計算データを出力できるように回路を変更する必要がある。その際には、フラグデコーダ 5 8の結果送達を出力すべき計算デ一夕の数だけ増やし、結果データレジスタ 6 2に読み込まれた計算デ一夕に対応する結果送達のみを 1にするようにプログラムを変更するだけで良い。

以上、本実施形態を説明したが、本発明は上述の実施形態には限定されることはなく、当業者であれば種々なる態様を実施可能であり、本発明の技術的思想を逸脱しない範囲において本発明の構成を適宜改変できることは当然であり、このような改変も、本発明の技術的範囲に属するものである。産業上の利用可能性

請求項 1及び 2記載の発明によれば、明度、彩度、色相などを用いても動画像中から移動物体単体若しくはその一部を一塊の領域として切り出すことが困難である場合、本発明は前記移動物体の数を数えることができる。例えば生きている透明なアメーバを数える場合、当然のことながらアメーバ全体に色を付けることはできない。また光源や背景を適当な色にしてもアメーバは同じ色になるか、光の屈折、反射などによりアメーバの中央と縁で異なる色になったりして、ァメーバだけを塗り潰したような画像を得ることも難しい。大半の場合、光の屈折、反射などにより、アメーバの輪郭部分に特異な輝度値が現れる。そこで本発明を用いれば、この特異な輝度値からエツジ情報を生成することによりァメ一バ全体を背景から切り出すことができるので、ァメ一バの数を数えることが容易になる。同様のことがミジンコなどの微生物、白血球や精子などの細胞にも当てはまる。もちろんおたまじゃくしゃ人間の顔のような色情報によって背景と容易に区別できる移動物体に対しても本発明を利用することができる。このように移動物体、光源及び背景に特に手を加えることなく移動物体の数を数えることができるので、移動物体を撮影することができる既存の装置に本発明を接続することで、移動物体用の物体計数装置を安価に実現することができる。その他に、動画像中に移動物体が有るか無いかを判定するといつた前処理にも利用することができる。なお、背景から分離された物体領域を本発明から直接取り出して別の装置に入力することで、移動物体を認識する際の前処理にも利用することができ、物体認識装置を安価に実現することもできる。

請求項 3記載の発明によれば、明度、彩度、色相などを用いても静止画像又は動画像のフレーム画像中から物体単体若しくはその一部を一塊の領域として切り出すことが困難である場合、本発明は前記物体の数を数えることができる。例えば透明なビーズを数える場合、当然のことながらビーズに色を付けることはできない。また光源や背景を適当な色にしてもビーズは同じ色になるか、光の屈折、反射などによりビーズの中央と縁で異なる色になったりして、ビーズだけを塗り潰したような画像を得ることも難しい。大半の場合、光の屈折、反射などにより、ビーズの輪郭部分に特異な輝度値が現れる。そこで本発明を用いれば、この特異な輝度値からエツジ情報を生成することによりビーズ全体を背景から切り出すことができるので、ビーズの数を数えることが容易になる。同様のことがミジンコなどの微生物、白血球や精子などの細胞にも当てはまる。もちろんおたまじゃくしゃ人間の顔のような色情報によって背景と容易に区別できる物体に対しても本発明を利用することができる。このように物体、光源及び背景に特に手を加えることなく物体の数を数えることができるので、物体を撮影することができる既存の装置に本発明を接続することで、物体用の物体計数装置を安価に実現することができる。その他に、静止画像中に物体が有るか無いかを判定するといつた前処理にも利用することができる。なお、背景から分離された物体領域を本発明から直接取り出して別の装置に入力することで、物体を認識する際の前処理にも利用することができ、物体認識装置を安価に実現することもできる。請求項 1、 2及び 3記載の発明によれば、明度、彩度、色相などを用いても動画像中から移動物体及び静止物体単体若しくはその一部を一塊の領域として切り出すことが困難である場合、本発明は前記物体のうち移動物体の数と全ての物体の数を数えることができる。例えば透明なアメーバのうち生きているアメーバと全てのアメーバを数える場合、ある一定時間に移動したアメーバを生きていると見なすとする。動画像のうち一定時間離れた 2つのフレーム画像か、一定^ f間を空けて撮影された 2つの静止画像を用いることで、本発明は移動しているアメーバの数と全てのアメーバの数を数えることができる。同様のことがミジンコなどの微生物、白血球や精子などの細胞にも当てはまる。もちろんおたまじゃくしゃ人間の顔のような色情報によって背景と容易に区別できる物体に対しても本発明を利用することができる。このように移動物体の数と全物体の数を 1つの装置で数えることができるので、移動物体の数と全物体の数を数える物体計数装置を安価に実現することができる。その他に、動画像中に移動物体若しくは静止物体が有るか無いかを判定するといった前処理にも利用することができる。なお、背景から分離された物体領域を本発明から直接取り出して別の装置に入力することで、移動物体若しくは静止物体を認識する際の前処理にも利用することができ、物体認識装置を安価に実現することもできる。

また請求項 1、 2及び 3記載の発明によれば、明度、彩度、色相などを用いても動画像中から移動物体及び静止物体単体若しくはその一部を一塊の領域として切り出すことが困難か不可能である場合、本発明は前記物体のうち移動物体の数と全物体の数を数え、移動物体と静止物体の数若しくは割合を計算することができる。例えば透明なアメーバの生存率を求める場合、ある一定時間に移動したアメーバを生きていると見なすとする。動画像のうち一定時間離れた 2つのフレーム画像か、一定時間を空けて撮影された 2つの静止画像を用いることで、本発明は移動しているアメーバの数と全てのアメーバの数を数えることができるので、アメーバの生存率を簡単に求めることができる。同様のことがミジンコなどの微生物、白血球や精子などの細胞にも当てはまる。もちろんおたまじゃくしや人間の顔のような色情報によって背景と容易に区別できる物体に対しても本発明を利用することができる。このように移動物体の数と静止物体の数を 1つの装置で数えることができるので、移動物体と静止物体の割合を計算する装置を安価に実現することができる。その他に、動画像中に移動物体若しくは静止物体が有るか無いかを判定するといつた前処理にも利用することができる。なお、背景から分離された物体領域を本発明から直接取り出して別の装置に入力することで、移動物体若しくは静止物体を認識する際の前処理にも利用することができ、物体認識装置を安価に実現することもできる。

請求項 4及び 5記載の発明によれば、三原色波長、可視光波長、赤外線波長、紫外線波長、その他全ての電磁波のうち任意の帯域から構成される動画像を用いて、本発明は移動カメラが撮影可能な範囲にある物体を探索することができる。物体が移動している場合には、移動物体の位置及び大きさを検知することにより、物体に向けて移動カメラの向きを合わせ、画像中の移動物体の大きさが一定になるように倍率を調整することができる。また物体が静止している場合には、移動力メラを細かく振動させることにより静止物体の位置及び大きさを検知することができるので、静止物体も移動物体と同様に移動力メラを制御することができる。さらに外部からも移動カメラを制御できるので、コンピュータなどと組み合せて利用することもできる。そこで本発明は以下のように利用することができる。例えば廊下など照明が安定している場所の他に玄関や屋外などノィズが多い場所などで人物や車や荷物などの物体を監視する場合、本発明はこれらの物体を適切な倍率でできるように移動カメラを制御することができる。またコンビニエンスストアやスーパ一マーケットなど動きの少ない場所でお客を集中的に撮影することで、本発明は万引き防止などの役に立つ。このように広範囲における物体の監視を 1つの装置で行えることができるので、物体監視装置を安価に実現することができる。その他に、動画像中に特定の物体が有るか無いかを判定するといつた前処理にも利用することができる。なお、背景から分離された物体領域を正規化した画像を本発明から直接取り出して別の装置に入力することで、移動物体若しくは静止物体を認識する際の前処理にも利用することができ、物体認識装置を安価に実現することもできる。

また請求項 5記載の発明によれば、三原色波長、可視光波長、赤外線波長、紫外線波長、その他全ての電磁波のうち任意の帯域から構成される動画像を用いて、本発明は移動カメラが撮影可能な範囲にある物体を探索することができる。これらの物体は適切な認識方法によって幾つかの種類に分類された後、位置や時刻などの属性と一緒に記録される。したがって一定時間内に移動力メラが撮影可能な範囲にある特定の物体の数を数えたり、物体の移動の軌跡を記録することができる。例えばカラオケボックスや商店街などで、本発明は客数や通行量などを計測することができる。またコンビニエンスストア、スーパーマーケット及び工場などで、お客の集まる場所を調査したり作業員の作業工程を記録することができる。またアミューズメントパークなどでは、「だるまさんがころんだ」といつたような移動物体探索ゲームゃシユーティングゲームなどに用いることができる。さらに本発明を口ポットに組み込むことにより、産業口ポットは製造ライン中のワークを探索したり、近づいてくる人間などを検知して動作を停止したりすることができるし、本発明は人型ロボットや盲導犬ロボッ卜などの移動ロボットの視覚機能を実現することができる。したがって自動車、バス、ダンプカーなどの車の前後左右に本発明を据付れば、本発明はドライバーの死角にある物体を見つけ出して警報を発することができるし、また近づいてくる車などの移動物体を事前に検知することもできるし、交通事故が発生した際の記録を取ることもできる。車いすに乗っている人にとっては首を回さずに視野を広げることができるので、特に後方から迫ってくる自転車や自動車を事前に察知することができ、事故防止にも役に立つ。さらに電車などの乗降口に本発明を設置することにより、本発明はドアに挟まれていたりドァの傍にいる乗客を見つけ出すこともできる。駅のプラットホームに本発明を設置すれば、本発明は線路に落ちた物を見つけ出したり、プラットホームの線路脇にいる人物に警告をすることもできる。また本発明を救助口ポットに設置すれば、救助口ポットは海岸、洋上及び河川などで遭難した人を見つけ出して自動的に近づくことにより救命胴衣やロープなどを遭難者まで運搬したり、遭難者を安全な場所に搬送したりすることができる。この救助口ポットは地震などで瓦礫の下敷になっている人を探すような場合にも利用できる。このように物体の探索、計数と移動軌跡の記録を 1つの装置で行えることができるので、物体探索装置、物体認識装置、物体計数装置、及び物体記録装置などを安価に実現することができる。

請求項 6記載の発明によれば、本発明はデジタル画像の各画素を並列に入力して、デジタル画像を画像単位又は画素単位で振動させた後、デジタル画像の各画素を並列に出力することができる。本発明は振動台などの物理的機構を使用しないので、デジタル画像を高速に振動させることができる。したがつて移動物体が高速に移動しているためにデジタル画像中の全物体のェッジ情報を実時間で生成する必要がある場合、本発明は必要な処理速度を達成することができる。

請求項 7記載の発明によれば、本発明はデジタル画像の各画素を並列に入力して、デジタル画像の各画素の粗エッジ情報を生成した後、粗エッジ情報を並列に出力することができる。生成された粗エッジ情報は物体の移動方向、移動速度及び物体と背景の色情報の差などによって影響を受けるため必ずしも正確ではなレ ^が、太陽光の当る屋外などノイズの多い環境でも特にデジタル画像を補正することなく任意の形状の移動物体の粗ェッジ情報を生成できるため、本発明は使用環境を限定することなく使用することができる。また本発明は赤外線、紫外線、さらには放射線などに対しても可視光波長、特に三原色波長と同様に扱うことができ、しかも帯域数を増やすほどノイズの影響を減らすことができる。この際本発明は記憶容量以外データ処理装置の回路を変更する必要がないので、容易に帯域数を増やすことができる。したがつて屋内のみならず屋外でも活動するような口ポットに対して、本発明は高速、かつ安価に移動物体の輪郭、位置及び大きさを提供することができる。しかも本発明は対象物を限定しない視覚認識装置に対して前処理としても効果的に働く。

請求項 8記載の発明によれば、本発明は粗エッジ情報及びデジタル画像の各画素を並列 - に入力して、デジタル画像を利用して粗エッジ情報から形成エッジ情報を生成した後、形成エッジ情報を並列に出力することができる。本発明は任意の方法によって生成された粗エッジ情報を、より明瞭で的確なエッジ情報に形成することができるので、粗エッジ情報を生成する手段に要する負荷を容易に低減することができる。しかも本発明は粗エッジ情報の品質に余り影響されないので、デジタル画像を低解像度にした低解像度デジタル画像の特定領域から生成した粗エッジ情報をより明瞭で的確なエッジ情報に形成することができる。したがってハードウェア量や計算量を増やすことなく、本発明は低倍率デジタル画像中の物体に対して高精細のエッジ情報を生成することができる。本発明により、これまで広角カメラと高精細カメラを用いてきた物体認識装置が 1つのカメラで物体認識を実現できるようになる。

請求項 9記載の発明によれば、本発明はエッジ情報を並列に入力して、エッジ情報で表される物体の位置及び大きさを検知した後、物体の位置及び大きさを重複情報として並列に出力することができる。多量のハードウェア量や計算量を要して検出された画像中の複数の物体の位置及び大きさと同程度かそれ以上の品質で、本発明は複数の物体のェッジ情報から位置及び大きさを一斉に検出することができる。ビデオカメラで撮影された動画像のフレーム画像若しくはデジタルカメラで撮影された静止画像から、その画像中の複数の物体の位置及び大きさを検出するための前処理にも利用され、静止画像及び動画像のパターン認識アルゴリズムなどを高速、かつ安価に実現することができる。

また請求項 9記載の発明によれば、本発明は物体領域画像の各画素を並列に入力して、物体領域画像の各画素で表される物体の位置及び大きさを検知した後、物体の位置及び大きさを重複情報として並列に出力することができる。多量のハードウェア量や計算量を要して検出された画像中の複数の物体の位置及び大きさと同程度かそれ以上の品質で、本発明は複数の物体の領域から位置及び大きさを一斉に検出することができる。特に細胞や精子のような円形部分を有する物体、さらには人間の顔のような円形と見なせる物体の位置及び大きさを検出する際に、それらの物体の領域からエッジ情報を再度生成する必要がないので、静止画像及び動画像のパターン認識アルゴリズムなどを高速、かつ安価に実現することができる。

請求項 1 0記載の発明によれば、本発明は物体領域画像の各画素及びデジタル画像の各画素を並列に入力して、デジタル画像中の物体領域を正規化した後、正規化画像の各画素を並列に出力することができる。多量のハードウェア量や計算量を要して生成された位置ずれに弱く隙間の多い正規化画像と同程度かそれ以上の品質で、本発明は物体領域画像の物体領域以外を用いてマスクされたデジタル画像の物体領域をデジタル画像のサイズに合わせて隙間を埋め合わせながら正規化することができる。ビデオカメラで撮影された動画像のフレーム画像若しくはデジタルカメラで撮影された静止画像から切り出された特定の物体を正規化するための前処理にも利用され、静止画像及び動画像のパターン認識ァルゴリズムなどを高速、かつ安価に実現することができる。

請求項 1 1記載の発明によれば、本発明は幾つかのテンプレート画像の各画素を並列に入力して、正規化画像の各画素を並列に入力して、テンプレート画像とパターンマツチングをした後、マッチング結果画像の各画素を並列に出力することができる。位置や大きさの異なる同じ物体に対して正規化画像の再現性が高ければ、本発明は近傍処理のみで正規化画像に類似した幾つかのテンプレート画像を選択することができる。そのため本発明は最小自乗誤差やニューラルネットワークなどの大域処理を最小限に抑えることができるので、静止画像及び動画像のパターン認識アルゴリズムなどを高速、かつ安価に実現することができる。

請求項 1 2記載の発明によれば、本発明は形成エッジ情報を並列に入力して、非線形振動子を用いて物体領域と背景領域を分離した後、物体領域画像の各画素を並列に出力することができる。本発明は、予めデジタル画像に関してエッジ情報の生成以外如何なる前処理も必要とせずに、デジタル画像中の物体の形、位置、向きに依存せず、またエッジ情報が破線であったり交差していても関係なく、さらにはデジタル画像中の物体領域が重なりあっていても、物体領域と背景領域を分離することができる。また本発明は、デジタル技術を用いてハードウェアを実装することを容易とし、実時間画像処理に適した高速化を可能とする。

請求項 1 3及び 1 4記載の発明によれば、本発明は視覚装置を高速に動作させることができる。特に画像サイズが大きくなつても並列性のために処理時間は変らない。そこで実時間性が必要な用途に対して視覚装置を利用することができる。またプログラムを変更するだけで、請求項 6から請求項 1 2までに記載された複数の手段を同一のチップで実現できるので、本発明は視覚装置を安価に製造することができる。さらに請求項 6から請求項 1 2までに記載された複数の手段を 1つのチップで実現できるので、このチップを移動カメラの中に容易に組み込むことができ、本発明は利便性を増すことができる。最後に、本発明は全て画素単位で信号を入出力しているので、複数のチップを積み重ねることにより配線量を抑えることができる。そこで三次元 V L S Iなどの技術革新によって本発明は容易に処理性能を向上することができる。

Claims

請求の範囲

1 . 動画像中の移動物体に対して、

前記動画像のフレーム画像を取得する手段と、

前記フレーム画像をデジタル画像として順次記憶する手段と、

前記デジタル画像から移動物体粗ェッジ情報画像を生成する手段と、

前記デジタル画像を用いて前記移動物体粗ェッジ情報画像から移動物体形成ェッジ情報画像を生成する手段と、

前記移動物体形成エッジ情報画像によって区分される移動物体領域の位置及び大きさを検出する手段と、

移動物体領域数を数える手段と、

前記移動物体領域数を保持する手段と、

を有する視覚装置。

2 . 動画像中の移動物体に対して、

前記動画像のフレーム画像を取得する手段と、

前記移動物体形成エッジ情報画像を用いて背景から移動物体領域を分離する手段と、前記移動物体領域の位置及び大きさを検出する手段と、

移動物体領域数を数える手段と、

前記移動物体領域数を保持する手段と、

を有する視覚装置。

3 . 請求項 1又は 2記載の視覚装置に対して、前記デジタル画像を振動させる手段を有することにより、前記移動物体の代りに全物体に対して全物体領域数を数えることを特徴とする視覚装置。

4 . 移動力メラによつて撮影された動画像中の任意物体に対して、

前記動画像のフレーム画像を取得する手段と、

前記デジタル画像から任意物体粗ェッジ情報画像を生成する手段と、

前記任意物体粗ェッジ情報画像によつて区分される任意物体領域の位置及び大きさを検出する手段と、

前記移動カメラの向き及び倍率を環境座標の位置に変換する手段と、

前記任意物体領域の前記位置及び前記大きさを前記環境座標の前記位置に変換する手段と、

複数の前記任意物体領域に対する前記環境座標の前記位置の中から 1つを選択する手段と、

外部からの制御命令を入力する手段と、

前記移動力メラを振動させる振動命令を生成する手段と、

前記移動カメラが移動すべき前記環境座標の前記位置を制御する手段と、

前記移動カメラを制御するカメラ命令を生成する手段と、

を有する視覚装置。

5 . 請求項 4記載の視覚装置に対して、

前記デジタル画像を用いて前記任意物体粗ェッジ情報画像から前記任意物体形成ェッジ情報画像を生成する手段と、

前記任意物体形成ェッジ情報画像を用いて背景から前記任意物体領域を分離する手段と、

前記任意物体領域を正規化する手段と、

任意物体正規化画像を保持する手段と、

前記任意物体正規化画像を認識する手段と、

認識結果を保持する手段と、前記環境座標で表された環境地図を生成する手段と、

前記環境地図を保持する手段と、

前記環境地図における前記任意物体の前記位置を推定する手段、

任意物体数を数える手段と、

前記任意物体数を保持する手段と、

前記任意物体形成エッジ情報画像を幾何解析する手段、

を有する視覚装置。

6 . デジタル画像を振動させる手段を実現するデータ処理装置において格子状に配置された配列演算ユニットの各々に対して、

前記配列演算ユニットを初期化する手段と、

入力すべき前記デジタル画像がなければ処理を終了する手段と、

前記デジタル画像の各帯域画素値を入力する手段と、

前記デジタル画像の前記各帯域画素値を上下左右に振動させる手段と、

振動画像の各帯域画素値を出力する手段と、

を備えたことを特徴とする視覚装置。

7 . デジタル画像から粗エッジ情報画像を生成する手段を実現するデータ処理装置において格子状に配置された配列演算ユニットの各々に対して、

前記配列演算ユニットを初期化する手段と、

前記デジタル画像の各帯域画素値を入力する手段と、

前記デジタル画像の前記各帯域画素値を平滑化して平滑化画像の各帯域画素値を生成する手段と、

前記平滑化画像の前記各帯域画素値の対数を取って対数変換画像の各帯域画素値を生成する手段と、

前記対数変換画像の前記各帯域画素値を鮮鋭化して鮮鋭化画像の各帯域画素値を生成する手段と、前記鮮鋭化画像の前記各帯域画素値から 1入力前鮮鋭化画像の各帯域画素値を引いて時間差分画像の各帯域画素値を生成する手段と、

前記鮮鋭化画像の前記各帯域画素値を前記 1入力前鮮鋭化画像の前記各帯域画素値に置き換える手段と、

前記時間差分画像の前記各帯域画素値に対してラプラシアンを計算して時間差分ラブラシアン画像の各帯域画素値を生成する手段と、

前記時間差分ラプラシァン画像の前記各帯域画素値のゼ口点を抽出して時間差分ゼ口点画像の各帯域画素値を生成する手段と、

前記時間差分ゼロ点画像の前記各帯域画素値の最大値を求めて最大値時間差分ゼロ点画像の帯域画素値を生成する手段と、

前記鮮鋭化画像の前記各帯域画素値に対して前記ラプラシアンを計算してラプラシァン画像の各帯域画素値を生成する手段と、

前記ラプラシアン画像の前記各帯域画素値の前記ゼ口点を抽出してゼロ点画像の各帯域画素値を生成する手段と、

前記ゼロ点画像の前記各帯域画素値の最大値を求めて最大値ゼロ点画像の帯域画素値を生成する手段と、

前記最大値ゼ口点画像の前記帯域画素値と前記最大値時間差分ゼ口点画像の前記帯域画素値のうち大きい方を求めて混成ゼロ点画像の帯域画素値を生成する手段と、前記混成ゼロ点画像の孔を除去して孔除去混成ゼロ点画像の帯域画素値を生成する手段と、

前記孔除去混成ゼロ点画像の孤立点および孤立孔を除去してノィズ除去混成ゼロ点画像の帯域画素値を生成する手段と、

前記ノィズ除去混成ゼ口点画像の前記各帯域画素値を反転して粗ェッジ情報画像の帯域画素値を生成する手段と、

前記粗エッジ情報画像の前記帯域画素値を出力する手段と、

を備えたことを特徴とする視覚装置。

8 . 粗エッジ情報画像から形成エッジ情報画像を生成する手段を実現するデータ処理装置において格子状に配置された配列演算ュニットの各々に対して、

前記配列演算ュニットを初期化する手段と、

入力すべきデジタル画像又は前記粗エッジ情報画像がなければ処理を終了する手段と、前記デジタル画像の各帯域画素値及び前記粗エッジ情報画像の帯域画素値を入力する手段と、

前記デジタル画像の前記各帯域画素値と前記粗エッジ情報画像の前記帯域画素値を分離する手段と、

前記対数変換画像の前記各帯域画素値を鮮鋭化して鮮鋭化画像の各帯域画素値を生成する手段と、

前記鮮鋭化画像の前記各帯域画素値に対してラプラシアンを計算してラプラシアン画像の各帯域画素値を生成する手段と、

前記ラプラシァン画像の前記各帯域画素値のゼ口点を抽出してゼロ点画像の各帯域画素値を生成する手段と、

前記最大値ゼロ点画像の前記帯域画素値を反転して基礎エッジ情報画像の帯域画素値を生成する手段と、

前記基礎ェッジ情報画像の前記帯域画素値に近づくように前記粗ェッジ情報画像の帯域画素値を整形する手段と、

前記粗ェッジ情報画像の前記帯域画素値の線幅を補間して形成ェッジ情報画像の帯域画素値を生成する手段と、前記形成エッジ情報画像の前記帯域画素値を出力する手段と、

を備えたことを特徴とする視覚装置。

9 . 物体領域の位置及び大きさを検出する手段を実現するデータ処理装置において格子状に配置された配列演算ユニットの各々に対して、

前記配列演算ュニットを初期化する手段と、

入力すべき粗エッジ情報画像がなければ処理を終了する手段と、

前記粗ェッジ情報画像の帯域画素値を入力する手段と、

前記粗エッジ情報画像の前記帯域画素値を重複情報画像の帯域画素値に変換する手段と、

前記重複情報画像から計算した移動量を移動量画像の帯域画素値に画像化する手段と、前記移動量画像の前記帯域画素値が指し示す移動位置に前記重複情報画像の前記帯域画素値を移動する手段と、

前記重複情報画像の前記帯域画素値を前記重複情報画像の移動元の前記帯域画素値の合計に更新する手段と、

前記重複情報画像の前記帯域画素値を出力する手段と、

を備えたことを特徴とする視覚装置。

1 0 . 物体領域を正規化する手段を実現するデータ処理装置において格子状に配置された配列演算ユニットの各々に対して、

前記配列演算ュニットを初期化する手段と、

入力すべき物体領域画像又はデジタル画像がなければ処理を終了する手段と、前記物体領域画像の帯域画素値及び前記デジタル画像の各帯域画素値を入力する手段と、

前記物体領域画像の前記帯域画素値と前記デジタル画像の前記各帯域画素値を分離して更新物体領域画像の帯域画素値及び更新画像の各帯域画素値を生成する手段と、前記更新物体領域画像から計算した移動量を移動量画像の帯域画素値に画像化する手段と、前記移動量画像の前記帯域画素値が指し示す移動位置の重複数に従い移動可能画像の帯域画素値を生成する手段と、

前記移動可能画像の判定に従い前記更新物体領域画像の前記帯域画素値を前記移動位置に移動する手段と、

前記更新物体領域画像の前記帯域画素値の移動に合わせて前記更新画像の前記各帯域画素値を移動する手段と、

前記物体領域に含まれない前記更新物体領域画像の前記帯域画素値に対して前記物体領域に含まれる近傍帯域画素値の平均値で補間する手段と、

前記更新物体領域画像の前記帯域画素値の補間に合わせて前記更新画像の前記各帯域画素値を補間する手段と、

前記更新画像を補間して生成した正規化画像の各帯域画素値を出力する手段と、を備えたことを特徴とする視覚装置。

1 1 . 正規化画像を認識する手段のうちパターンマッチングを実現するデータ処理装置において格子状に配置された配列演算ユニットの各々に対して、

前記配列演算ユニットを格子状に配置する手段と、

前記配列演算ュニットを初期化する手段と、

入力すべきテンプレート画像がなくなるまで前記テンプレート画像の帯域画素値を入力する手段と、

入力すべき前記正規化画像がなければ処理を終了する手段と、

前記正規化画像の帯域画素値を入力する手段と、

マッチング結果を計算する手段と、

マッチング結果画像を更新する手段と、

前記マッチング結果画像の帯域画素値を出力する手段と、

を備えたことを特徴とする視覚装置。

1 2 . 形成エッジ情報画像を用いて物体領域を分離する手段を実現するデータ処理装置において格子状に配置された配列演算ュニットの各々に対して、前記配列演算ユニットを格子状に配置する手段と、

前記配列演算ュニット中の非線形振動子と、前記非線形振動子の近傍にある前記非線形振動子とを結合値で接続する手段と、

前記配列演算ュニットを初期化する手段と、

入力すべき前記形成エッジ情報画像がなければ処理を終了する手段と、

前記形成ェッジ情報画像の帯域画素値を入力する手段と、

外乱を計算する手段と、

前記非線形振動子の近傍入力合計を計算する手段と、

前記非線形振動子のパラメ一夕を計算する手段と、

前記非線形振動子の出力を計算する手段と、

輪郭パラメータを計算する手段と、

境界パラメ一夕を計算する手段と、

前記非線形振動子によって分離された前記物体領域を含む物体領域画像の帯域画素値を出力する手段と、

を備えたことを特徴とする視覚装置。

1 3 . データを入力する手段と、

前記データを順次記憶する手段と、

配列演算ユニット間で前記デ一夕を転送する手段と、

前記デ一夕を用いて計算する手段と、

前記データを出力する手段と、

を有する前記配列演算ユニットに対して、

前記配列演算ユニットを格子状に配置する手段と、

前記配列演算ュニットの各々の位置関係から近傍同士を相互結合する手段と、隣接する前記配列演算ュニット間で前記デ一夕を通信する手段と、

前記配列演算ュニットの各々を独立に動作させる手段と、

を特徴とする視覚装置。

1 4. 配列演算ユニットは、

入力したデータを処理する手段を備えたプロセッサと、

前記データを処理するプログラムと変数を記憶するためのメモリと、

隣接する前記配列演算ュニットと通信するためのコントローラと、

を備え、

前記コントローラは、

入力した前記データを前記メモリに記憶する手段と、

前記メモリ中の前記変数を隣接する前記配列演算ュニットに送信する手段と、隣接する前記配列演算ユニットから送信された前記変数を前記メモリに記憶する手段と、

を備えたことを特徴とする視覚装置。