WO1991017507A1

WO1991017507A1 - Parallel data processing system

Info

Publication number: WO1991017507A1
Application number: PCT/JP1991/000604
Authority: WO
Inventors: Takashi Kan
Original assignee: Mitsubishi Denki Kabushiki Kaisha
Priority date: 1990-05-07
Filing date: 1991-05-07
Publication date: 1991-11-14
Also published as: GB9200168D0; US5355508A; GB2250362A; GB2250362B

Description

明細書

並列データ処理システム

技術分野

この発明は、高速データ処理を行なうための並列データ処理分野に関するものである。背景技術

第 4図と第 5図は、例えば文献 "Highly Parallel Computing " (G.S.Almasi, A . Gottlieb 著， The Ben ja mi n/Cu minings Publising Company, Inc. ,1989) _PPlll-112,pp301-476に示される従来の並列データ処理装置の例を示す基本構成図である。第 4図は、制御の流れがーつで，処理されるデータの流れが複数である S I M D (Single Instruction Stream, Multiple Data Streams) 型の並列データ処理装置、第 5図は、制御の流れもデータの流れも複数である M I MD (Multiple Instruction Streams, Multiple Data Streams^型の並列データ処理装置を示す。

第 4図中、 1， 2， 3及び 4は演算器、 5， 6 , 7及び 8は各々の口一カルメモリ、 9はメモリバス、 1 0は共有メモリ、 1 1 は装置全体の制御を行う全体制御部である。また、第 5図中、 2 1， 2 2， 2 3及ぴ 24は演算器、 2 5 , 2 6， 2 7及び 2 8は各々の口一カルメモリ、 3 5， 3 6， 3 7及び 3 8は各々の制御部、 2 9 はメモリバス、 3 0は共有メモリ、 3 1は全体制御部である。

次に動作について説明する。

第 4図の S I MD型並列データ処理装置では、プログラムが実行される全体制御部 1 1 から全ての演算器 1〜4へ同一命令が同時に発せられ、各々の口一カルメモリ 5〜 8のデータを処理する。また、処理の途中で必要に応じて、メモリバス 9 を介して共有メモリ 1 0にアクセスする。

一方、第 5図の M I M D型並列データ処理装置では、各プロセッザの制御部 3 5〜 3 8で各々プログラムが実行され、各々の演算器 2 1〜24に対して命令が発せられ、次にこれにより、各々のローカルメモリ 2 5〜 2 8のデータに対して処理が行われる。また、処理の途中で必要に応じて、メモリバス 29 を介して共有メモリ 30 にアクセスする。全体制御部 3 1は装置全体の同期や監視のための制御を行う。

このような従来の S I MD型と M I M D型の並列データ処理装置には、それぞれに長所と短所があった。すなわち、 S I MD型並列データ処理装置の場合は制御の流れが-一本であるため、制御が単純で，大規模な並列処理を行うことが容易であり、非常に高い高速性が得られやすい。しかし、その反面，処理に柔軟性が少なく、複雑な処理には適さない。

一方、 M I MD型並列データ処理装置の場合は各プロセッサが個々に動作するため、各々が高度な処理を行える。しかし、その分だけ制御は複雑になリ、大規模な並列処理には適さない。

このように、 S I MD型と M I MD型では並列処理の内容がかなリ異なるため、各々に適した応用分野がある。そのため、どちらか一方の方式で広い応用分野をカバ一することは非常に困難となる。

以下では、並列データ処理の適用分野として特に重要な数値計算と画像処理の分野を例にとり具体的に説明する。

まず、数値計算の分野においてその処理モデルは、（ 1 ) モンテカルロシミュレーションに代表される粒子系モデル、（ 2 ) 物理現象を対象とした変微分方程式の解法を行なう連続系モデル、（ 3 ) ネットワークの解析などを対象とした連立方程式の解法を行なう離散系モデル、に大きく分類できる。これらのうち、連続系モデルは大量の規則的かつ局所的演算の繰り返しであるため、 S I MD型の大規模な並列処理が適している。一方、離散系モデルでは大規模な並列性は必要ないが複維な処理が要求されるため、中規模の M I M D型の並列処理が適している。さらに、粒子系モデルの場合は大規模かつ複雑な処理が要求される場合が多く、条件やデータ数によリ、 S I M Dと M I M Dの使い分けが必要である。

次に、画像処理の場合は、（ 1 ) 濃度値変換や 2値化のような画素単位の処理、（ 2 ) 空間フィルタの様な近傍画素間の処理、 ( 3 ) 幾何変換や高速フーリエ変換の様な大局的な処理、（4 ) ラベリングゃ境界線検出の様な浸透または追跡型の処理、に大きく分類される。これらのうち、画素単位処理や近傍画素間処理には単純で大規模な処理であるため S I M Dが適しており、大局処理では複雑で広範な処理が必要なため M I M D型が適している。浸透/追跡型は条件やデータ数により、 S I M Dと M I M Dの使い分けが必要である。

このように、数値計算と画像処理の例をみても、ある特定の分野でさえ様々なタイプの処理があリ、一つの並列処理アーキテクチャだけで最適な並列処理を施すことは困難である。

この発明は上記のような問題点を解消するためになされたもので、 S I M D型と M I M D型の両者の長所を生かし、かつ各々の欠点をカバーし、広い応用分野のどの分野でも最適に近い並列処理アーキテクチャを適用可能とすることを目的としている。発明の開示

この発明に係る並列データ処理システムは、制御の流れが一つで，処理されるデータの流れが複数である第 1の並列データ処理装置，すなわち S I M D型の並列データ処理装置と、制御の流れもデータの流れも複数である第 2の並列データ処理装置，すなわち M I M D型の並列データ処理装置とを共有のバスとメモリで接続するとともに、各々の並列データ処理装置に適した処理を行わせるシステム制御部を備えることにより、広い範囲で最適な並列処理方式を適用できるようにしたものであり、対象となる処理が単純で大量のデータ処理が必要なものを S I M D型並列データ処理装置で処理し、複雑な処理で少量のデータ処理の場合は M I MD型並列データ処理装置で処理する。また、一つのプログラムをモジュールに分け、モジュール毎に割り振ることも可能で、これにより各々の適した処理を並列に，もしくはパイプライン的に行うことができる。これらのデータの受け渡しは共有メモリを介して行われる。すなわち、どちらか一方の型の並列データ処理装置を拡充するよりは、このように両者の型を結合し、補完し合った方が機能的にもコスト的にも有効である。

また、本発明では、上記のような数値計算や画像処理の分野での問題を解決するため、 S I MD型と M I MD型の異なる二つのタイプの並列データ処理装置を共有メモリと高速多重バスによリ密結合し、相補的に使用することにより、広い分野で効率的な並列処理を施すことができるハイプリッド型並列データ処理システムを実現する。

このようなハイブリッドの考えを取り入れた並列アーキテクチャとして、従来の S I M Dを M I M D的に機能拡張した M S I MD (Multiple SIMD)を採用した University of Texas の T RA C Iexas Reconf igurable Array Computer) や Purdue University の P A S M (Partitionable SIHD/HIHD system)などがあった。し力、し、これらのアプローチと比べ本発明では、次にような特徴がある。（ 1 ) 同等規模の S I MDと M I MDの二つの並列データ処理装置を個別に持ち対等に密結合したこと、（ 2 ) 雨並列データ処理装置が各々 S I MDと M I MDの長所を生かしつつ従来の欠点を補う機能拡張を行なっていること、（ 3 ) 雨並列データ処理装置間のデータ転送を効率的に行なうため高速多重バスと大容量高速共有メモリを持つこと、（4 ) 従来の並列処理では実現できなかったハイブリジドなパイプライン処理や並列処理が可能である。

このようなハイブリツド型並列データ処理システムを、画像処理のような大規模でかつ複維な処理に適用することによリ、従来のシステムでは有効時間内での処理が困難た'つた処理を実用時間内で高速に処理することができる。図面の簡単な説明

第 1図は本発明の一実施例による並列データ処理システムを示すシステム構成図、第 2図は本発明を適用したシステム例を示す具体的構成図、第 3図は本発明の実施によリ実現できる並列処理の流れを示す図である。第 4図は従来の S I M D型並列データ処理装置の例を示す基本構成図、第 5図は従来の M I M D型並列データ処理装置の例を示す基本構成図である。発明を実施するための最良の形態

以下、この発明の一実施例を図について説明する。

第 1図は実施例のシステム構成図であり、図において、 5 0は前記第 4図と同様の S I M D型の並列データ処理装置、 5 1は前記第 5図と同様の M I M D型の並列データ処理装置である。また、 4 1 はこの両者で共有するメモリバス、 4 2は同じく共通に利用し、両者のデータの受け渡しを行う共有メモリ、 4 3は応用プログラムの中で、各処理を各々によリ適した方の並列データ処理装置へ振り分けるためのシステム制御部である。

次に動作について説明する。

第 1図のシステムにおいて、応用プログラムの実行制御はシステム制御部 4 3で行われる。プログラムの中で、 S I M D型向きの処理，すなわち処理は単鈍であるが大量のデータ処理を必要とするものは S I M D型並列データ処理装置 5 0 へ、また、 M I M D型向きの処理，すなわち複雑な処理で少量のデータ処理のものは M I M D 型並列データ処理装置 5 1へ振り分けられる。この場合、ユーザからは両者を明示することもできるし、暗示的に使用することもできる。暗示的な例はライブラリであり、ユーザがある機能のライブラリを使用した場合には、そのライブラリをコールした時点で最適な方の並列データ処理装置が指示される。

一つのプログラム内で S I MD型並列データ処理装置 5 0と M l MD型並列データ処理装置 5 1 を両方使用する大きなレベルでの並列処理やパイプライン処理も可能である。この時には、システム制御部 4 3の制御で行われるが、データの受け渡しはメモリバス 4 1 を介し共有メモリ 4 2により行われる。このため、メモリバス 4 1 は高速なものが要求される。

なお、上記実施例では、各々の並列データ処理装置が 4台のプロセッサから成る例を示したが、通常、 S I M D型の場合は非常に多数のプロセッサを持ち、 M I MD型の方は比較的少数である。これらのプロセッサ台数の比率は、各々のプロセッサの性能や応用プログラムの性格によつて決定されるものである。

また、前述の雨並列データ処理装置を使った大きなレベルでの並列動作やパイプライン処理を行う場合、バス 4 1 を一時的に分雛したり、バスを 2本以上持たせることも有効となる。

以上のように、この発明によれば、 S I M D型と M I M D型の並列データ処理装置を結合し、各並列データ処理装置に適した処理を行わせるようにしたので、 S I MD型か M I MD型のどちらか一方だけを拡充して使用し広い応用分野に適用するよリも、性能とコス卜の両面で有利となり、輻広い分野でよリ適した並列処理を行うことができるようになる効果がある。

次に、本発明を実現した具体的な適用例を第 2図に示す。基本構成は第 1図と同様であるが、個々のブロックの中身をさらに細かに示している。

第 2図中、 4 1 , 4 2 , 4 3， 5 0， 5 1のブロックはそれぞれ第 1 図と同様、共有メモリバス，共有メモリ，システム制御部， S I MD型並列データ処理装置， M I M D型並列データ処理装置を示す。共有メモリバス 4 1は、 2本のバス 9 6 , 9 7 と各々のバス接続部 9 4， 9 5で構成される。このような多重バスとしたのは、二つの並列データ処理装置 5 0 , 5 1 からの共有メモリ 4 2へのァクセス競合を避けるためと、システム制御部 4 3からのデータの入出力と演算を同時に行なうためである。通常のモードでは、バスに接続されている全ての信号は、どちらか空いている方のバスを使用できるほか、どちらかの並列データ処理装置が同時に両方のバスを占有して、入力と出力にそれぞれ使用することもできる。また、これらの二つのバス 9 6， 9 7はバス接続部 9 4， 9 5で接続される。このバス接続部 9 4， 9 5はバス 9 6， 9 7を S I M D型並列データ処理装置 5 0側と M I M D型並列データ処理装置 5 1側に分離したり、接続したりする機能を持つ。この切り替え機構は、セレクタにより実現され、接続時はそのままつながり、切り離し時はバス接続部 9 4， 9 5の両側にあるバス終端抵抗へ接続され、二つの並列データ処理装置 5 0 , 5 1のそれぞれ独立したバスとして使用できる。このバス接続部 9 4， 9 5は、システム制御部 4 3からの信号により接続と切リ離しの制御が行なわれる。

共有メモリ 4 2は、一般に複数のセグメントに分割されるが第 2図では 4つのセグメントの例を示す。各々のセグメント 9 8， 9 9 , 1 0 0， 1 0 1は 1 6メガバイ卜の容量を持ち、個別に共有メモリバス 4 1 に接続されている。共有メモリ 4 2を使用する場合はセグメント番号とセグメント内アドレスを指定する。通常のユーザプログラムは，論理セグメント番号を使用し、物理セグメント番号との対応はシステム制御部 4 3によリ行なわれる。また、各セグメントそれぞれが独自にアドレス計算を行なう機能を持ち、余分なアドレス情報がバスを使用することを避けることにより、二つの並列データ処理装置 5 0， 5 1は共有メモリ 4 2と高速なデータ転送を行なうことができ、本発明の効果をさらに向上することができる (特願昭 61- 288740 号）。システム制御部 4 3は、データ処理部 9 0，メモリ部 9 1 ，バス接続部 9 2，ディスク装置 9 3，内部バス 1 0 6から構成される。通常、ユーザプログラムはデータ処理部 9 0で処理され、プログラムはメモリ部 9 1に格鈉されている。処理されるデータはディスク装置 9 3に格鈉されておリ、共有メモリバス接続部 9 2を経由して共有メモリ 4 2に転送され、いずれか又は面方の並列データ処理装置 5 0 , 5 1により処理される。また、処理されたデータはバス接続部 9 2を経由してディスク装置 9 3に格納される。

S I MD型並列データ処理装置 5 0は、全体制御部 1 1，出力制御部 1 0 2，入力制御部 1 0 3， 4 0 9 6個の演算要素 1 0 8から構成される。一つの演算要素 1 0 8は 8ビット演算器 1 と 1 6 K ビッ卜の口一カルメモリ 5から構成され、これらが格子状に 4近傍演算要素間で接続されてる。各演算器は 8ビットの加減算器のほか複数の制御フラグ， 1 2 8ビッ卜のレジスタファイルなどから構成される（US Patent No.4, 858, 110) 。 S I MD型並列データ処理装置 5 0全体の制御は全体制御部 1 1 によって行なわれ、ここから同一の命令が全ての演算要素 1 0 8に同時に送られる。処理されるデータは、全体制御部 1 1の指令により、共有メモリ 4 2から入力制御部 1 0 3を経由して各演算要素 1 0 8に送られる。また、処理されたデータは出力制御部 1 0 2を経由して共有メモリ 4 2に返される。データの入出力と演算をオーバ一ラップさせることも可能で、それによりデータのブロック単位にパイプライン的に処理を高速化することができ、本発明をさらに効果的にすることができる (特願昭 59-29485号，特公平 1-26108 号公報）。これらの機能によリ、 S I MD型の並列処理を実現し、大規模なデータを同時に並列処理することができる。

M I MD型並列データ処理装置 5 1は、全体制御部 3 1，入出力制御部 1 04 , 1 0 5， 8つの演算要素 1 0 9及びこれらを接続するバス 1 0 7から構成される。各演算要素 1 0 9は、 3 2ビット演算器 2 1， 1 MBの口一カルメモリ 2 5，制御部 3 5を持ち、それぞれ個別に異なる命令列を実行することができる。 M I M D型並列データ処理装置 5 1全体の制御は全体制御部 3 1 によって行なわれ、ここから各演算要素 1 0 9に実行される命令列が送られ、制御される。また、処理されるデータは全体制御部 3 1の指令により、共有メモリ 4 2から入出力制御部 1 04， 1 0 5のいずれかを経由して各演算要素 1 0 9に送られる。また、処理されたデータは入出力制御部 1 04， 1 0 5のいずれかを経由して共有メモリ 4 2に返される。

次に、本発明の実施によリ実現できる 4つの並列処理について第 3図を用いて説明する。第 3図は、第 2図で示したシステム構成例により、各並列処理の流れを時間に沿って記述したもので、基本的に二つの並列データ処理装置 5 0， 5 1による二つの並列処理の流れが存在する。 6 0は S I M D型並列データ処理装置 5 0の 4 0 9 6個の演算要素 1 0 8が作リ出す多数の微細な S I MD型並列処理の流れを示し、 6 6 , 6 8 , 7 2は S I MD型並列デ一タ処理装置 5 0により演算が行なわれている部分を示す。 6 1は M I M D型並列データ処理装置 5 1の 8つの演算要素 1 0 9が作り出す高機能で融通性が高い M I MD型並列処理の流れを示し、 6 5 , 7 0， 7 3は M I M D型並列データ処理装置 5 1により演算が行なわれている部分を示す。 6 2は共有メモリ内のデータを示し、 6 3 , 64， 6 7， 6 9， 7 1， 74 , 7 5がそれぞれアクセスされるデータを示す。 1 1 0 , 1 1 1 , 1 1 2はそれぞれ S I MD型並列デ一タ処理装置 5 0と M I M D型並列データ処理装置 5 1によるハイブリツド処理の流れを示す。

個々の並列処理 6 0， 6 1は従来からあり、これまでこのどちらかの並列処理を使用していたが、本発明の実施により、さらにこれらを組み合わせたハイブリッド並列処理特有の新たな並列処理の流れを生み出すことができる。即ち、本実施例では、従来の方式では実現できなかった次の 3種類の並列処理を使用できる。

( 1 ) システム制御部 4 3で実行される一つ又は複数のプログラムにより、 S I M D型並列データ処理装置 5 0と M I M D型並列データ処理装置 5 1 をそれぞれ独立に同時に使用し、共有メモリ内の異なるデータ 64， 6 3に対して処理を施すことができる。このようなハイブリツド並列処理を 1 1 0で示す。この機能によリ、一つのシステムにおいて、同一の手続きで異なるタイプの並列処理を同時に使用できる。従来の方式では、異なるタイプの並列処理手法を利用するためには異なるシステムを使用しなくてはならず、手続きも異なっていた。

( 2 ) 連続する一連のデータセッ卜（例えば画像）単位に二つの並列データ処理装置 5 0， 5 1 をパイプライン的に処理させるハイプリッド並列処理を 1 1 1に示す。共有メモリのデータ 6 7を使用し、まず S I MD型並列データ処理装置 5 0が処理 6 8を施し、その結果を共有メモリ（データ 6 9 ) 経由で M I M D型並列データ処理装置 5 1 に渡し、継続して異なる並列処理 7 0を施す。この処理を行なうためには、システム制御部 4 3が同期制御やデータセッ卜の制御を行なう。二つの並列データ処理装置 5 0 , 5 1間のデータの受け渡しは共有メモリ 4 2を通して行なわれ、このオーバ一へッドを最小に抑えるため、共有メモリバス 9 6， 9 7と共有メモリ 4 2の各セグメント 9 8， 9 9， 1 0 0， 1 0 1は各々の並列デ一タ処理装置 5 0， 5 1に独立に使用される。これらの結果、対象の処理を機能レベルに細かに分割し、各機能によリ適した並列データ処理装置を用い、データセッ卜単位で無駄のないパイプライン処理を行なうことができる。

( 3 ) 二つの並列データ処理装置 5 0 , 5 ] を個別に独立に平行動作させるハイプリッド並列処理を 1 1 2に示す。この場合は共有メモリのデータ 7 1 を使用し、 S I M D型並列データ処理装置 5 0 が処理 7 2を施し、同時に M I MD型並列データ処理装置 5 1が同じデータ 7 1 を使用して異なる並列処理 7 3を施す。この場合、異なるプログラムが各々の並列データ処理装置 5 0 , 5 1で個別に動作することもあれば、同一プログラム内で同一データセットに対して異なる並列アルゴリズムを用いて並列処理を行なうこともある。このような並列処理は、アルゴリズム，収束性，精度，並列度などが異なる並列処理方式を同時に同一データに施せるため、両者の結果を比較して信頼性を上げたり、早く結果が出た方を使用して性能を上げたりすることができる。この様な処理は従来の方式では実現できずハイブリツド手法特有のものである。

以上のように、本発明の実施により、ハイブリッド型並列処理特有の新しい並列処理を実現することができ、空間的にも時間的にも従来方式以上に並列処理の適用範囲を広めることができる。

次に、本発明を実施するためのソフトウェア構成例を示す。本発明では、ュ一ザが使用するための並列処理ライブラリと、二つの並列データ処理装置 5 0 , 5 1や共有メモリ 4 2を使いハイブリッド処理を制御するためのシステム制御ソフトウェァがある。

まず、並列処理ライブラリは、ユーザに二つの並列データ処理装置 5 0， 5 1 を容易に使用できるように提供されるもので、通常、適した方の並列データ処理装置用に用意され登録されている。また、同一の処理でありながら、それぞれの並列データ処理装置用に異なるアルゴリズムで別々に用意されているものもある。ュ一ザは通常、システム制御部 4 3の上で動作するュ一ザプログラムからサブル一チンコールによリ、これらのライブラリを使って二つの並列データ処理装置 5 0， 5 1 を使用する。いずれの並列データ処理装置を使用するかは、ライブラリを指定した時点でシステム制御部 4 3が認識して、適した方の並列データ処理装置に起動をかけるが、予め明示することもできる。このほか、ユーザが直接いずれかの並列データ処理装置の実行ライブラリを記述することもできる。また、かなり制約はあるものの、ュ一ザプログラムを、自動的にいずれか適した方の並列データ処理装置を選んで並列ライブラリに置き換えるコンパイラも有効である。

一方、システム制御ソフトウェアは、本発明のハイブリッド並列処理を実現するための制御ソフトウヱァでは、（i ) 二つの並列データ処理装置 5 0 , 5 1の並列及びパイプライン制御、（ii ) 各並列データ処理装置 5 0 , 5 1 と共有メモリ 4 2とのデータ転送のオーバ一ラップ制御、（iii ) 処理に適した方の並列データ処理装置をユーザが意識せずにアクセスできる機能、（iv) システム全体の空間的，時間的並列処理動作をモニタリングする機能、を有している。

これらの機能を実現するため、システム制御ソフトウエアでは、様々な管理を行ない各構成要素の同時実行や排他制御を行なう。即ち、（i ) 二つの並列データ処理装置 5 0， 5 1の資源管理、

( ii) 共有メモリ 4 2の複数のセグメン卜のデータ管理、（iii ) 並列処理ライブラリの管理、（iv) 並列処理ライブラリの実行制御、

( v ) 共有メモリ 4 2のデータ入出力管理、を行なう。

次に、本発明の画像処理への適用例について述べる。前述のように画像処理には様々な処理があリ、その処理形態の分類方法にもいくつかのものがあるが、並列処理の観点から大別すると、（ 1 ) 近傍処理：画素間または近傍画素間で比較的単鈍な演算を一様に施す処理と、（ 2 ) 大局処理：画像全体に対して比較的複維な演算を施す処理、に分かれる。

このように性貧の異なる 2種類の処理をいずれも効率よく高速に並列実行するために、本発明では概ね、近傍処理を S I M D型並列データ処理装置 5 0、大局処理を M I M D型並列データ処理装置 5 1 が主に分担し、広い範囲で効率的な並列処理を可能とする。このように、両方の並列データ処理装置を使い分けることにより、空間的にも時間的にも広い範囲でより適した並列処理を施すことができる。また、各処理をさらに分割してハイブリッド並列処理を適用することにより、さらに広い分野で最大限の並列処理を行なうことが可能となる。以下では具体的に本発明による性能面での効果について述べる。

本発明の効果を画像処理を例に、演算レベル，機能レベル，応用プログラムレベルの各々について述べる。

まず、演算レベルの評価では、一般に、 S I M D型並列デ一タ処理装置 5 0は、整数演算や短いビット長のデータの処理に適した構成をとることが多く、これらの処理に対しては、大規模な並列処理により超高速性能を発揮することができる。一方、 M I M D型並列データ処理装置 5 1は演算器の制限から大規模な並列処理の実現は難しいが、浮動小数点演算や複雑な処理には適している。

画像処理では、処理に応じて、数ビット整数データから 3 2ビット実数データまで様々なデータを扱うが、処理内容やデータに応じた演算器構成を選択することによリ、そのプロセッサの最高性能を引き出すことができる。概ね短いビット長の整数データ処理には S I M D型並列データ処理装置 5 0の方が高い性能を出すことができ、長いビット長の実数データ処理には M I M D型並列データ処理装置 5 1の方が高い性能を出せる。従って、この二つを最適に割り当てることにより、処理に対応した並列処理によリ最高性能を引き出すことができる。

次に、機能レベルの性能の例として、代表的な 5つの画像処理に対する S I M D型データ処理装置 5 0と M I M D型並列データ処理装置 5 1 の相対性能比を示す。図 2 に示した構成のシステムの場合、それぞれ、ァフィン変換では 1 : 5、ヒストグラム作成では 1 ： 4、濃度値変換では 2 ： 1 、高速フーリエ変換では 3 ： 1 、一様重み付きフィルタでは 6 ： 1であり、性能が高い方が低い方に比べ約 2倍から 6倍高い。この性能評価で使用した S I M D型並列データ処理装置 5 0と M I M D型並列データ処理装置 5 1はほぼ同等のハードウェア量であり、このことから、単一の並列処理ァーキテクチヤだけを使用するよりも、本発明のようにハイブリツドの並列処理アーキテクチャを採る方が効率的であることがわかる。

最後に、応用プログラムレベルの性能評価として、人工衛星搭載光学系センサ一からのデータに対する一連の実用レベルの画像処理に対して、本発明の評価を行なった。その結果、単一の並列データ処理装置だけを使用した場合に比べ、 2 . 6倍から 2 . 8倍の性能を得ることができ、本発明の有効性が実証できた。産業上の利用可能性

本発明によるハイブリツド型並列処理アーキテクチャの採用によリ、単一アーキテクチャに比べ時間的にも空間的にも並列処理の適用可能範囲を大幅に広げることができ、様々なタイブの画像処理に対して各々の処理に適した並列処理を動的に適用することが可能となった。これにより、大規模で複锥な画像データの処理のように、従来のコンピュ一タでは有効な時間内での処理が困難だつた処理を実用時間内で高速に処理することができる。

Claims

請求の範囲 . 制御の流れが一つで，処理されるデータの流れが複数である第 1の並列データ処理装置と、制御の流れもデータの流れも複数である第 2の並列データ処理装置とを共有のバスとメモリで接続するとともに、各々の並列データ処理装置に適した処理を行わせるシステム制御部を備えたことを特徴とする並列データ処理システム。

. 共有バスは、各々の並列データ処理装置が独立して使用可能な高速多重バスからなり、共有メモリは、複数のセグメントに分割され各々個別に多重バスに接続される大容量高速共有メモリからなり、システム制御部は，ユーザプログラムが処理されるデータ処理部と、プログラムが格納されるメモリ部と、処理されるデータが格納されるディスク部と、多重バスと接続するためのバス接続部と、これらを接続する内部バスとを有し、各々の並列データ処理装置には、多重バスとの間でデータの入出力を行なう入出力制御部を有し、各々の並列データ処理装置を上記共有メモリと高速多重バスによリ密結合したことを特徴とする請求の範囲第 1項記載の並列データ処理システム。

. 各々の並列データ処理装置をそれぞれ独立に同時に使用し、共有メモリ内の異なるデータに対して処理を施すハイブリッド並列処理を行なうことを特徴とする請求の範囲第 1項又は第 2項記載の並列データ処理システム。

. 連続する一連のデータセッ卜単位に各々の並列データ処理装置をパイプライン的に処理させるハイプリッド並列処理を行なうことを特徴とする請求の範囲第 1項又は第 2項記載の並列データ処理システム

. 各々の並列データ処理装置を個別に独立に平行動作させ、共有メモリ内の同じデータに対して異なる並列処理を施すハイブリツド並列処理を行なうことを特徴とする請求の範囲第 1項又は第 2 項記載の並列データ処理システム。

. 画像処理において、画素間または近傍画素間で比較的単鈍な演算を一様に施す近傍処理を第 1の並列データ処理装置に、画像全体に対して比較的複雑な演算を施す大局処理を第 2の並列データ処理装置に主に分担させることを特徴とする請求の範囲第 1項又は第 2項記載の並列データ処理システム。